이 책은 NLP와 컴퓨터 언어학 알고리즘을 사용해 추론하고 데이터를 이해할 수 있는 방법을 제시한다. 알고리즘은 통계적 머신 러닝과 인공지능 기술을 기반으로 한다. 이런 알고리즘들을 다루기 위한 도구(파이썬과 젠심, 스파이시와 같은 도구)를 바로 사용할 수도 있다.
가장 먼저 데이터를 정제하는 방법에 대해 배운 다음 첫 번째 개념으로 컴퓨터 언어학을 수행하는 방법을 배우게 될 것이다. 이제 실제 사용하는 언어와 텍스트 예제를 파이썬을 이용해 보다 정교한 통계적 NLP와 딥러닝을 탐색할 수 있다. 훌륭한 도구를 사용해 텍스트를 태깅하고 구문을 분석하고 모델링하는 방법을 배운다. 사용해야 할 가장 최적의 프레임워크가 무엇인지 알게 될 것이며 토픽 모델을 위해 젠심을 선택하거나 딥러닝을 위해 케라스를 선택하는 것과 같이 도구를 언제 어떤 것을 선택할지 알게 될 것이다.
이 책은 자신의 NLP 프로젝트와 컴퓨터 언어 처리를 배우고 수행할 수 있도록 이론과 실습을 균형 있게 다룬다. 여러분은 풍부한 파이썬 도구의 생태계를 발견하고 흥미로운 현대 텍스트 분석의 세계로 들어갈 수 있을 것이다.