Курс магистратуры “Компьютерная лингвистика” НИУ ВШЭ
День | Тема | Материалы |
---|---|---|
13.01 | Введение. Типы данных и типы количественных лингвистических исследований | Слайды |
Основы языка R | Lab1 Rmd; Учебник, гл. 1-8 | |
20.01 | R: Чтение данных. Визуализации: ggplot2 | Lab2 Rmd; Учебник, гл. 14 |
27.01 | R: Tidyverse. Работа с таблицами. Описательные статистики | Lab3 Rmd; Data wrangling cheat sheet; упражнения keys; Учебник, гл. 9-12 |
03.02 | Распределения. Выборки. Центральная предельная теорема. | Слайды |
Стандартная ошибка. Доверительные интервалы | Lab4; Учебник, гл. 17 | |
10.02 | Проверка статистических гипотез: H0. t-test и его непараметрические аналоги | Слайды; Lab5 html; Учебник, гл. 17-18 и 20 |
Корреляционный анализ | ||
17.02 | Дисперсионный анализ (ANOVA). Величина эффекта | Слайды; Lab6, html; Учебник, гл. 19 и 22 |
24.02 | Критерий хи-квадрат и точный тест Фишера, величина эффекта для номинальных переменных | Lab7, html |
17.03 | Линейная регрессия. Принципы выбора моделей | Учебник, гл. 21; Lab8, html; Cheat sheet: статистики как lm |
Сдаются на почту gmail neurolong@
с темой с темой da4cl
накануне семинара
Hvitfeldt, Emil. Feature Engineering A-Z (https://feaz-book.com/)
Wickham, H. R for data science: import, tidy, transform, visualize, and
model data. 2017 (https://r4ds.hadley.nz/)
Wickham, H. ggplot2: elegant graphics for data analysis. 2009 (https://ggplot2-book.org)
Tabachnick, Barbara G., & Linda S. Fidell. Using multivariate
statistics. 2014 (https://hisp.htmi.ch/pluginfile.php/77114/mod_resource/content/0/Using%20Multivariate%20Statistics%20%28Tabachnick%20and%20Fidell%29.pdf)
Silge, Julia, & David Robinson. Text Mining with R: A Tidy Approach.
O’Reilly Media, 2017 (https://www.tidytextmining.com/)
Levshina N. How to do Linguistics with R: Data exploration and
statistical analysis. 2015.
Baayen, R. H. Analyzing linguistic data: a practical introduction to
statistics using R. 2014.
Gries St. T. Statistics for Linguistics with R. 3rd ed. 2021.
Поздняков И. Анализ данных и статистика в R (https://pozdniakov.github.io/tidy_stats) Алиева О.
Компьютерный анализ текста в R. 2023 (https://locusclassicus.github.io/text_analysis_2023)
Продвинутые главы:
Мороз Г. Введение в анализ данных на R для гуманитарных и социальных
наук. 2022 (https://agricolamz.github.io/daR4hs)
Harney, H. L. (2016). Bayesian Inference: Data Evaluation and Decisions
(Vol. 2nd ed). Springer.
McElreath, R. (2016). Statistical Rethinking: A Bayesian Course with
Examples in R and Stan. eBook (https://github.com/rmcelreath/stat_rethinking_2024)
Nicenboim, Bruno, Daniel J. Schad, and Shravan Vasishth. An Introduction
to Bayesian Data Analysis for Cognitive Science. 2024 (https://bruno.nicenboim.me/bayescogsci/)