본문 바로가기

[회고] 다채로웠던 2024년 돌아보기 (더 나은 2025년을 위하여) 어느덧 정신없이 시간을 보내다보니 2025년 새해의 1월도 열흘 정도밖에 남지 않았다..!!원래 미래지향적인 사람이라 회고보다는 계획하는 것을 좋아했는데, 최근 들어 미래를 생각하며 계획만 세우고 그 계획을 제대로 실현시키지 못한 채로 또 다른 계획을 세우는 스스로를 보게 되었다.과거를 제대로 돌아보고 알고 있어야 더 잘 나아갈 수 있겠다는 생각에 뒤늦게나마 2024년을 돌아보고자 한다.2024년 돌아보기우선 2024년에 있었던 일들을 학창시절 수학시간에 많이 보던 좌표(😅)를 변형해서 정리해보았다.위쪽은 업무 관련, 아래쪽은 업무 외적 관련된 일들로 + 오른쪽은 좋았던 부분과 왼쪽은 아쉬웠던 부분으로 나눠보았다.적은 내용 중 핵심이라고 생각되었던 일들에 대한 생각을 정리해보고자 한다.(사용한 툴은 2..
[KG] 지식그래프를 담기 위한 데이터베이스 (+RDF / SPARQL) 최근 지식그래프를 다루면서 어떤 데이터베이스에 담는 것이 효율적일지 알아보게 되었다.탐색 중 지인 분을 통해 한 서베이 논문에서 지식그래프 스토리지에 대해 상세하게 분석해 놓은 것을 알게 되었다.따라서 이번 글에서는 논문 A Survey of RDF Stores & SPARQL Engines for Querying Knowledge Graphs (2021) 을 기반으로 각 RDF와 SPARQL 개념과 기술은 어떤 것인지, 그리고 이를 기반으로 한 데이터베이스에는 어떤 종류가 있는지 살펴보고자 한다. RDF란?Resource Description Framework (RDF) 는 웹 상의 데이터를 시맨틱하게 표현하기 위한 W3C 표준이다. (정의 자체가 좀 어렵게 느껴질 수도 있지만..) 데이터를 구조적으로..
[KG] 온톨로지는 어떻게 만들고 평가할 수 있을까? 지난 주말 감사한 기회를 통해 제 6회 GUG 세미나에 연사자로서 참여하게 되었다.GUG 세미나는 Graph User Group이라는 그래프 기술 지식교류 모임에서 주최하는 세미나로,이번 세미나는 '온톨로지와 GraphRAG'라는 주제로 다뤄지게 되었다. GUG 6번째 세미나 - 온톨로지와 GraphRAG · Luma환영합니다! 이벤트에 참여하려면 아래에 등록해 주세요.lu.ma온톨로지와 관련된 여러 주제 중 '온톨로지 구축 및 평가'를 주제로 발표하게 되었는데,업무에서 지식그래프를 처음 접하게 되었던 시기에 어떻게 온톨로지를 만들게 되었는지와그 이후에 정량적인 지표를 통해 온톨로지를 평가 방식에 대하여 이야기를 나누게 되었다.이번 글에서도 해당 세미나 내용을 중심으로 조금 더 깊이 있게 다뤄보고자 한다..
[KG] GraphRAG: RAG에 지식그래프 더하기 (논문 Review - From Local to Global: A GraphRAG Approach to Query-Focused Summarization) 최근(이라기에는 꽤 오래 전부터) RAG라는 용어가 빈번하게 들려오기 시작했는데,알고 보니 업무에서 진행하고 있던 지식그래프 검색과 어느 정도 연관되어 있었다 👀LLM이 더 대답을 잘 하기 위하여 문서로부터 정보를 검색하는 RAG에서,더 나아가 지식그래프와 결합하여 더욱 정확한 정보를 얻는 GraphRAG가 화두되고 있다.Microsoft에서 올해 초(2024년 4월) 이와 연관된 논문 및 python 패키지를 공개하여 이에 대해 살펴보고자 한다. RAG(Retrieval Augmented Generation)란?LLM을 사용하다 보면 종종 잘못된 정보를 진실처럼 답변하는 환각 현상을 경험해봤을 것이다.이러한 hallucination 문제를 해결하고자 제기된 RAG는 외부 지식 출처로부터 정보를 가져와..
[글또] 10기를 시작하며 (2024년 미리 돌아보기 + 마무리 준비) 글또 마지막 기수 10기가 시작되었다!👏이번에는 기술 중심 위주로 글을 써보려고 해서 시작 다짐글을 패스하려고 했으나..무작정 글들을 쓰려고 보니 중심이 잘 잡히지 않는다는 생각이 들어 작성하게 되었다. (역시 시작 매듭은 중요하다..!)글또가 시작된 10월을 기점으로 미리 2024년을 돌아보고, 남은 한 해를 어떻게 잘 보낼 수 있을지 action items를 정리해보고자 한다.2024년 (미리) 돌아보기사실 이번 해는 고민과 어려운 점들이 많아지는, 인생 곡선 기울기가 급격히 하강하는 성장통을 겪는 시기였다.굵직하게는 아래 3가지로 구분지어 볼 수 있을 것 같다.휴직작년 말, 스스로 커리어 방향과 미래의 삶에 대한 재정비를 해보고자 1-4월에 휴직을 결심하게 되었다.(휴직 관련 글: https://..
[Python] 파이썬 웹 프레임워크 입맛대로 골라보기 (Django, Flask, FastAPI 비교) 업무를 진행하다보면 좀 더 효율적으로 빠르게 작업하거나 결과를 확인할 수 있는 툴을 만들고자 하는 니즈가 자주 있었다. 그 덕분에 백엔드 개발자가 아님에도 불구하고 웹 프레임워크를 경험할 일이 꽤나 빈번하게 발생했다. 주로 demo를 만들어야 할 때는 Django를, 간단한 기능을 만들 때는 Flask를 사용하게 되었는데, 최근 FastAPI도 많이 사용되는 것을 보고 한번 써봤더니 가장 쉽게 구축할 수 있었다. 이왕 이렇게 다양하게 쓰게 된다면, 각각 어떤 장단점이 있는건지 제대로 알고 필요에 따라 적절하게 선택해서 사용해 봐야겠다는 생각이 들었다. 따라서 이번 글에서는 아래 순서대로 Python 웹 프레임워크들에 대해 살펴보고자 한다. (1) 대표 프레임워크(Django, Flask, FastAPI)..
[udemy - Apache Spark와 Python으로 빅데이터 다루기] Spark란? 해당 글은 글또 커뮤니티를 통해 제공 받은 udemy 강의 를 기반으로 작성되었습니다. 데이터 엔지니어라면 한번쯤은 들어보고 다뤄 봤을 기술인 Spark 💫 하지만 정작 Spark에 대한 정의를 설명해보라고 하면 익숙한 만큼 표현하기 어렵게 느껴진다. 이번 글에서는 Spark란 무엇인지, 어떤 식으로 구성되어 있는지 기초적인 부분을 다뤄보고자 한다. Spark란 무엇인가? Spark의 공식 이름은 Apache Spark로, 아파치 소프트웨어 재단에서 운영하고 있다. 공식 사이트(https://spark.apache.org)에 들어가 보면 아래와 같이 Spark를 정의하고 있다. Apache Spark™ is a multi-language engine for executing data engineering..
[CPython 파헤치기] 사실 Python은 C로 구성되어 있다 - CPython 구성 요소 살펴보기 해당 글은 도서 CPython 파헤치기 1-4장을 기반으로 작성되었습니다. Python은 아래 2023년 stack overflow survey의 결과에서도 보여주고 있듯이 많은 개발자들에게 사랑받고 있는 언어 중 하나이다. 실제로 업무에서나 다른 개발 작업을 할 때 내가 가장 주 언어로 사용하고 있는 것이 Python인데, 정작 이렇게 많이 사용하고 있으면서 내부 구조를 어떻게 구성되어 있는지 알지 못해 매번 궁금했었다. 그래서 이번 글에서는 CPython 파헤치기 관련 첫번째 글로, C로 구성되어 있는 Python의 전반적인 내부 구조와 문법에 대해 살펴보고자 한다. C로 구성되어 있는 Python 우리가 일반적으로 이용하고 있는, 공식 사이트 python.org에서 다운로드 받는 python은 C로..