콘텐츠 기반 필터링에 PinnerSage 입히기

안녕하세요, 머신러닝 엔지니어 카터입니다. 지난 글에서 공유드린 바와 같이 라이너는 추천 시스템의 여러 꼭지 중 하나로 콘텐츠 기반 필터링을 계속해서 발전시켜 나가고 있습니다. 많은 분들이 이미 알고 계시듯 콘텐츠 기반 필터링은 Cold start 에 강점을 지니며, Sparse 한 사용자-아이템 인터랙션 매트릭스로 인한 추천 모델 학습의 어려움에서 비교적 자유롭다는 장점을 지니고 더보기…

서버 비용 아끼는 법

클라우드 서비스에 첫 가입 후 제공받는 달달한 소규모의 크레딧으로 첫 VM을 띄우며 개발을 시작했던 때가 떠오른다. AWS 같은 경우는 스타트업 프로그램이 잘 되어있고 너무나도 친절하게 자사의 서비스들을 십분 활용할 수 있도록 초기 아키텍처를 잡는 방법들도 알려준다. 여기에 더 나아가 대부분의 대형 클라우드 업체에서는 스타트업을 위해 추가로 크레딧을 제공한다. 커리어 대부분을 더보기…

알림 시스템 구축하기(상) – 유저에게 먼저 다가가는 서비스 만들기

안녕하세요! LINER에서 백엔드 개발을 맡고 있는 토니입니다. 라이너가 하이라이트 유틸리티 툴에서 커뮤니티로 본격적으로 바뀐지 벌써 4개월이 지났습니다. 커뮤니티에서는 서비스와 유저의 상호 작용 뿐만 아니라, 유저와 유저 사이의 상호 작용도 잘 구성해야합니다. 커뮤니티와 SNS에서 유저간 상호 작용을 구성하는 다양한 장치 중 중요한 자리를 차지하고 있는 알림 시스템을 어떻게 개발했는지 이야기 해볼까 더보기…

Bag-of-Tricks for Recommendation: Recency, Clustering 그리고 Item Shuffling

안녕하세요, 머신러닝 엔지니어 카터입니다. 추천 시스템을 프로덕트에 적용하게 되면 이전에는 볼 수 없었던 수많은 문제점들이 보이기 시작합니다. 이번 글에서는 제가 라이너 추천 시스템을 개발하며 마주했던 문제 사항들과 해당 문제들을 해결하기 위해 적용한 방법론들에 대한 이야기를 드리고자 합니다. Recency: 최신성 고려하기 첫 번째 문제는 콘텐츠의 최신성에서 시작되었습니다. 엔지니어인 저는 주로 개발 더보기…

장애물을 다루는 기술: 다국어 처리부터 웹에서 유튜브 하이라이트 기능까지

“장애물을 마주했다고 반드시 멈춰 서야 하는 건 아니다. 벽에 부딪힌다고 돌아서거나 포기하지 말라. 어떻게 벽을 오를지, 뚫고 나갈지 또는 돌아갈지 생각하라.” – 마이클 조던 – 얼마 전 베이징 동계올림픽 쇼트트랙 남자 1,000m 준결승에서 조 1위로 결승선을 통과하고도 편파 판정으로 실격을 당하고 결승에 진출하지 못했던 황대헌 선수를 기억하시나요? 해당 경기를 지켜봤던 더보기…

토픽 모델링으로 그리게 될 LINER의 미래

안녕하세요, 머신러닝 엔지니어 카터입니다. 지난 글에서는 라이너의 컨텐츠 기반 필터링 모듈 구축기에 대한 소개를 드렸습니다. 이번 글에서는 현재 라이너가 토픽 모델링을 어떻게 활용하고 있으며, 앞으로의 라이너 기술 발전 방향에 있어 토픽 모델링이 왜 중요한지에 대한 소개를 드리고자 합니다! 토픽 모델링이란 ? “라이너 ❤️ 토픽 모델링” 이야기에 앞서 토픽 모델링이란 무엇인가부터 더보기…

컨텐츠 기반 필터링 구축기: MiniLM, ScaNN 그리고 TFServing

안녕하세요, 머신러닝 엔지니어 카터입니다. 지난 번에는 외부로부터 추천 아이템이 축적되는 라이너가 컨텐츠 퀄리티 컨트롤을 위해 필터링 로직을 어떻게 가져가고 있는지에 대한 소개를 드렸습니다. 이번 글에서는 라이너가 컨텐츠 기반 필터링을 어떻게 구축하여 추천 시스템에 활용하고 있는지에 대해 소개드리고자 합니다! ANN과 ScaNN 라이너는 수백만 개 문서 중 사용자에게 추천할 만한 문서 수백 더보기…

LINER와 함께하는 쾌적한 정보 탐색 여정

안녕하세요. 프론트엔드 엔지니어로 근무 중인 제제입니다 🙂 벌써 LINER와 함께한지 1년이 지났다는게 감개무량하네요. 그동안 가입전환율 증대, SEO 프로젝트 등을 진행하며 주로 몸 담았던 웹 플랫폼을 뒤로하고, 브라우저 익스텐션에 입성한 저의 브라우저 익스텐션 데뷔글을 재밌게 읽어주시길 바랍니다! 이런 경험 없으셨나요? 구글 검색 결과에서 원하는 정보를 찾지 못해 좌절하거나, 수십개의 사이트를 방문한 더보기…

양질 중 우선시 되어야 하는 것은? Quality!

개요 안녕하세요, 머신러닝 엔지니어로 근무 중인 카터입니다! 이번 포스트에서는 세상에 존재하는 모든 텍스트 컨텐츠가 적재될 수 있는 라이너에서 사용자에게 양질의 추천을 제공하기 위해 컨텐츠 필터링을 어떤 식으로 수행하고 있는지, 그리고 앞으로 어떻게 발전시키고자 하는지에 대해 소개드리고자 합니다. 라이너는 사용자의 텍스트 하이라이트 이벤트를 추천 모델링을 위한 사용자 피드백으로 적극 활용하고 있습니다. 더보기…

SNS에 하이라이트 공유 기능 추가하기

안녕하세요? LINER 팀에서 브라우저 익스텐션 개발을 맡고 있는 마크입니다! 확장 프로그램이라고도 불리는 ‘브라우저 익스텐션’은 웹 브라우저의 기존 동작을 변경하거나 완전히 새로운 기능을 추가할 수 있는 무궁무진한 웹 브라우저용 프로그램입니다. LINER 팀의 대표적인 프로덕트도 브라우저 익스텐션이에요. 👉 브라우저 익스텐션에 대해 좀 더 알고 싶다면?https://developer.mozilla.org/en-US/docs/Mozilla/Add-ons/WebExtensions 입사하고 한 달 정도 지날 무렵, 처음으로 더보기…