Прикладной анализ текстовых данных на Python. Машинное...

Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка

Бенджамин Бенгфорт, Ребекка Билбро, Тони Охеда
5.0 / 0
0 comments
你有多喜歡這本書?
文件的質量如何?
下載本書進行質量評估
下載文件的質量如何?
Технологии анализа текстовой информации стремительно меняются под влиянием машинного обучения. Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения.
Нейронные сети способны решать самые сложные задачи обработки естественного языка, никого не удивляет машинный перевод, «беседа» с роботом в интернет-магазине, перефразирование, ответы на вопросы и поддержание диалога.
Почему же Сири, Алекса и Алиса не хотят нас понимать, Google находит не то, что мы ищем, а машинные переводчики веселят нас примерами «трудностей перевода» с китайского на албанский? Ответ кроется в мелочах – в алгоритмах, которые правильно работают в теории, но сложно реализуются на практике.
Научитесь применять методы машинного обучения для анализа текста в реальных задачах, используя возможности и библиотеки Python. От поиска модели и предварительной обработки данных вы перейдете к приемам классификации и кластеризации текстов, затем приступите к визуальной интерпретации, анализу графов, а после знакомства с приемами масштабирования научитесь использовать глубокое обучение для анализа текста.

ОГЛАВЛЕНИЕ :

Вступление

1. Естественные языки и вычисления

2. Создание собственного корпуса

3. Предварительная обработка и преобразование корпуса

4. Конвейеры векторизации и преобразования

5. Классификация в текстовом анализе

6. Кластеризация для выявления сходств в тексте

7. Контекстно-зависимый анализ текста

8. Визуализация текста

9. Графовые методы анализа текста

10. Чат-боты

11. Масштабирование анализа текста

12. Глубокое обучение и не только

Глоссарий

Об авторах

Выходные данные

年:
2019
版本:
1
出版商:
СПб.: Питер
語言:
russian
頁數:
368
ISBN 10:
5446111532
ISBN 13:
9785446111534
系列:
Бестселлеры O’REILLY
文件:
PDF, 10.30 MB
IPFS:
CID , CID Blake2b
russian, 2019
下載 (pdf, 10.30 MB)
轉換進行中
轉換為 失敗

最常見的術語