알라딘

헤더배너
상품평점 help

분류

이름:디팍 아가왈 (Deepak K. Agarwal)

최근작
2022년 5월 <[세트] 추천 시스템 원리와 구현 세트 - 전2권>

디팍 아가왈(Deepak K. Agarwal)

빅데이터 분석가로 웹 애플리케이션의 검색 능력 개선에 기여한 최신 머신러닝과 통계 기법을 다년간 개발 및 배포한 경험을 가지고 있다. 또한 어려운 빅데이터 문제, 특히 추천 시스템과 컴퓨터 광고 분야의 문제를 해결하기 위한 연구를 주도했다. 미국통계협회(American Statistical Association)의 선임 연구원이며 통계 분야 최고권위 학술지의 편집장을 역임하고 있다.  

대표작
모두보기
저자의 말

<추천 시스템의 통계 기법> - 2022년 5월  더보기

컴퓨터 과학, 머신러닝, 통계학 등 여러 분야의 추천 시스템에 관한 책이 많지만 주로 특정 부분에만 집중하며, 모든 통계 문제나 그것들이 서로 어떻게 연관되는지 포괄적으로 다루고 있지는 않다. 야후!와 링크드인에서 시스템을 개발하면서 문제를 깨닫게 됐다. 통계학이나 머신러닝에서 관심은 아웃-오브-샘플(out-of-sample) 데이터를 대상으로 한 예측 오차가 가장 낮은 모델을 만드는 것이다. 하지만 이런 접근 방식은 현실적으로 중요한 모든 요소를 다루지 못한다. 통계학적 측면에서 추천 시스템은 다차원 순차 프로세스로 실험 설계 등 문제를 연구하는 것이 훌륭한 통계 모델을 개발하는 것만큼 중요하다. 실제로 두 가지는 서로 밀접한 관계가 있다. 효율적인 디자인은 차원 수의 저주를 잘 다루는 모델을 가지고 있어야 한다. 또한 지금까지 출판된 내용은 대부분 하나의 요소, 가령 영화 평점, 구매 내역, 클릭률(click rate) 등에 반응하는 모델의 구성을 얘기하고 있다. 페이스북, 링크드인, 트위터와 같은 소셜미디어의 등장으로 다양한 반응을 사용할 수 있게 됐다. 예를 들어, 누군가는 뉴스 추천 애플리케이션을 위해 클릭률, 공유 비율, 트윗 비율 등을 동시에 모델링하고 싶을 수도 있다. 이처럼 여러 변수에 반응하는 모델은 구성하기가 쉽지 않다. 다변수 예측을 할 수 있는 기반이 있다고 하더라도 추천에 필요한 유틸리티 함수는 어떻게 구성해야 하는가? 클릭률보다 공유율을 최적화하는 것이 더 중요한가? 문제의 답은 도메인 전문가와의 긴밀한 협업을 통한 유틸리티 매개변수 일부 도출과 다목적 최적화로 얻을 수 있다. 이 책의 목적은 추천 시스템과 관련된 이런 문제를 종합적으로 살펴보는 것이다. 물론 기본적인 목적은 적응형 순차 디자인(멀티 암드 밴딧 기법), 이중선형 랜덤-효과 모델(행렬 분해), 최신 분산형 컴퓨팅 인프라를 활용한 확장형 모델 등 현재 최신 통계 기법에 관해 자세히 알아본다. 업계에서 이런 대형 시스템을 구성했던 오랜 경험을 바탕으로 문제를 통계, 머신러닝, 컴퓨터 과학 커뮤니티와 공유하기 위한 목적으로 썼다. 이 책은 이론과 실무의 차이를 메우는 데 도움이 될 것이다. 문제를 마주친 사람에게는 연관된 통계 문제를 충분히 이해할 수 있게 해주고, 모델을 구성하고 있는 사람에게는 실제로 적용했을 때 발생하는 복잡한 통계 문제를 깊이 이해할 수 있게 해 줄 것이다.

가나다별 l l l l l l l l l l l l l l 기타
국내문학상수상자
국내어린이문학상수상자
해외문학상수상자
해외어린이문학상수상자