본문 바로가기

DATA SCIENCE/DEEP LEARNING

[CS224W] 3-1. Node Embeddings

이 포스트는 CS224W : Machine Learning with Graphs 강의를 기반으로 작성되었습니다.

Graph representation learning은 
task에 상관없이 그래프를 사용한 머신러닝이 효율적으로 feature 학습을 하는 것이다.
매번 feature engineering을 하지 않아도 되며, 벡터가 네트워크 구조를 capture하도록 한다.

이를 위해 필요한 node embedding에 대해 알아보고자 한다.

node embedding

node를 임베딩 공간으로 맵핑하는 것으로,
node를 인코딩해서 임베딩 공간 내 유사성이 네트워크 내 유사성을 나타내도록 하는 것이다.

학습 과정은 다음과 같다.

  1. encoder (ENC) 정의 : node가 embedding 공간으로 mapping되도록
    (각 node를 저차원 벡터로 mapping)
  2. similarity score 정의 : 네트워크 내 node 유사도(node similarity)를 나타내기 위한 함수 정의
  3. decoder (DEC) 정의 : embedding 공간에서 similarity score로 mapping
  4. encoder의 파라미터 optimize 시키기

shallow encoding

가장 간단한 인코딩 방법으로,
encoder를 embedding-lookup하듯이 node마다 unique한 임베딩 벡터가 할당되도록 하는 것이다.
따라서 임베딩 행렬에 node 개수만큼 column이 존재하며,
간단하지만 node 개수가 많을 때는 부적합한 방식이다.

 

 

반응형