Прикладной анализ текстовых данных на Python. Машинное обучение и создание приложений обработки естественного языка
Бенджамин Бенгфорт, Ребекка Билбро, Тони Охеда
Технологии анализа текстовой информации стремительно меняются под влиянием машинного обучения. Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения.
Нейронные сети способны решать самые сложные задачи обработки естественного языка, никого не удивляет машинный перевод, «беседа» с роботом в интернет-магазине, перефразирование, ответы на вопросы и поддержание диалога.
Почему же Сири, Алекса и Алиса не хотят нас понимать, Google находит не то, что мы ищем, а машинные переводчики веселят нас примерами «трудностей перевода» с китайского на албанский? Ответ кроется в мелочах – в алгоритмах, которые правильно работают в теории, но сложно реализуются на практике.
Научитесь применять методы машинного обучения для анализа текста в реальных задачах, используя возможности и библиотеки Python. От поиска модели и предварительной обработки данных вы перейдете к приемам классификации и кластеризации текстов, затем приступите к визуальной интерпретации, анализу графов, а после знакомства с приемами масштабирования научитесь использовать глубокое обучение для анализа текста.
Нейронные сети способны решать самые сложные задачи обработки естественного языка, никого не удивляет машинный перевод, «беседа» с роботом в интернет-магазине, перефразирование, ответы на вопросы и поддержание диалога.
Почему же Сири, Алекса и Алиса не хотят нас понимать, Google находит не то, что мы ищем, а машинные переводчики веселят нас примерами «трудностей перевода» с китайского на албанский? Ответ кроется в мелочах – в алгоритмах, которые правильно работают в теории, но сложно реализуются на практике.
Научитесь применять методы машинного обучения для анализа текста в реальных задачах, используя возможности и библиотеки Python. От поиска модели и предварительной обработки данных вы перейдете к приемам классификации и кластеризации текстов, затем приступите к визуальной интерпретации, анализу графов, а после знакомства с приемами масштабирования научитесь использовать глубокое обучение для анализа текста.
ОГЛАВЛЕНИЕ :
Вступление
1. Естественные языки и вычисления
2. Создание собственного корпуса
3. Предварительная обработка и преобразование корпуса
4. Конвейеры векторизации и преобразования
5. Классификация в текстовом анализе
6. Кластеризация для выявления сходств в тексте
7. Контекстно-зависимый анализ текста
8. Визуализация текста
9. Графовые методы анализа текста
10. Чат-боты
11. Масштабирование анализа текста
12. Глубокое обучение и не только
Глоссарий
Об авторах
Выходные данные
年:
2019
版本:
1
出版商:
СПб.: Питер
語言:
russian
頁數:
368
ISBN 10:
5446111532
ISBN 13:
9785446111534
系列:
Бестселлеры O’REILLY
文件:
PDF, 10.30 MB
IPFS:
,
russian, 2019