Національна Академія наук України
Викладач:
кандидат соціологічних наук СЕРЕДА ЮЛІЯ ВАЛЕРІЇВНА, науковий співробітник відділу моніторингових досліджень соціально-економічних трансформацій ДУ "Інститут економіки та прогнозування НАН України". Впродовж 2012-2013 рр. проходила навчання зі статистики в Університеті штату Нью-Йорк у м. Олбані (США). Брала участь у тренінгах з аналізу даних в університетах Іспанії, Хорватії, Німеччини та Росії. Член української дослідницької команди міжнародного проекту "Дослідження європейських цінностей" (Eropean Values Study). Член Соціологічної асоціації України та Міжнародної соціологічної асоціації (ISA). Переможець конкурсу "Кращий молодий соціолог року" (2011 р.). Має досвід роботи у R, SAS, Stata та SPSS.
Мета: оволодіти методами прикладної статистики, що необхідні у соціології, маркетингу, бізнесі та сфері суспільного здоров'я для прийняття аргументованих рішень на основі доказових результатів статистичних методів.
Результати навчання: розвиток не тільки технічних навичок виконання аналізу у комп'ютерних статистичних пакетах, а й розуміння логіки та структури аналізу, знання основних визначень та формул, грамотний вибір методів та моделей, включаючи оцінку їх надійності. Розвиток статистичного мислення, що дозволить не залежати від однієї комп'ютерної програми.
Аудиторія: соціологи, маркетологи, економісти, фахівці зі стратегічного планування, викладачі вишів, аналітики, епідеміологи тощо.
Програмне забезпечення, що використовується у навчанні - R.
Чому саме R?
- Це абсолютно безкоштовна програма з відкритим кодом, що підтримує різні операційні системи (Windows, Mac OS, Linux).
- R - дуже потужне середовище для роботи з даними, він використовується від фізики до соціології. На сьогодні, R - це глобальний інструмент аналізу даних для будь-яких завдань.
- Практично всі університети Західної Європи та США використовують R для аналізу даних. Програма набуває популярності у великих міжнародних корпораціях.
- За рахунок того, що над розвитком R працюють вчені зі всього світу, найостанніші методики одразу знаходять відображення у R.
Учасники майстер-класів забезпечуються комплектом матеріалів в електронному вигляді (включаючи англомовні джерела, що не знаходяться у публічному доступі). У ході навчання основний матеріал надається у форматі мультимедійних презентацій, а також з використанням програмного забезпечення R. Кожен модуль передбачає виконання практичних завдань, що дозволить апробувати отримані навички. Учасники можуть використовувати власні ноутбуки та бази даних за їх наявності.
8-9 листопада 2013 року
МОДУЛЬ №1. "Основи аналізу даних у R"
(10 акад. годин)
Анотація: модуль спрямовано на ознайомлення з базовими основами програми R, такими як: імпорт на організація даних, логіка формулювання команд та графічна візуалізація. Цей майстер-клас є першим кроком на шляху використання R у статистичному аналізі.
Програмне забезпечення: R
Програма:
o Знайомство з R (про проект, установка, способи введення даних, ресурси) - 2 акад. години
o Об'єкти в R (вектори, матриці, списки, бази даних) - 2 акад. години
o Базові функції та створення власних функцій - 4 акад. години
o Симуляції - 1 акад. година
o Створення графіків в R - 1 акад. година
Необхідні навички для участі: досвід роботи з базами даних.
24-25 листопада 2013 року
МОДУЛЬ №2. "Багаторівневі (ієрархічні) моделі зі змішаними ефектами
(Multilevel models with mixed effects)" (22 акад. години)
Анотація: Багаторівневі моделі (hierarchical linear models, nested models, mixed models, random coefficient, random-effects models, random parameter models) широко застосовуються у порівняльних та лонгітюдних дослідженнях. Це статистичні моделі, що дозволяють варіацію (дисперсію) параметрів на різних рівнях, наприклад індивідуальному (населення) та груповому (країни). Цей метод аналізу набуває все більшого поширення у прикладній статистиці завдяки зручності його використання в міжнародних порівняльних дослідженнях. Модуль охоплює лінійні та нелінійні багаторівневі моделі для залежних змінних з різними типами шкал.
Програмне забезпечення: R
Програма:
o Основи багаторівневого моделювання - 8 акад. годин
o Порівняння груп з використанням багаторівневого моделювання
o Багаторівнева регресія з незалежними змінними першого рівня
o Використання випадкових точок перетину (random intercept model)
o Використання випадкових коефіцієнтів нахилу (random slope model)
o Багаторівневі моделі для дихотомічних залежних змінних - 8 акад. годин
o Дворівнева модель
o Оцінка ефекту на різних рівнях
o Прогнозовані ймовірності в багаторівневої моделі
o Дворівнева модель з випадковим коефіцієнтом нахилу (random slope model)
o Додавання змінних другого рівня: ефект контексту
o Багаторівневі моделі для порядкових відповідей: кумулятивна логістична модель - 2 акад. години
o Трирівнева модель, додаткові рівні - 2 акад. години
o Діагностика багаторівневих моделей - 2 акад. години
Необхідні навички для участі: бажано спочатку пройти модуль ╧1, в іншому випадку потрібен досвід роботи з базами даних, знання одновимірного аналізу, лінійної, логістичної та порядкової регресії, розуміння основ роботи у R або впевнене користування будь-якими іншими статистичними пакетами*.
* Коди для практичної реалізації аналізу будуть надаватися у R.
Грудень 2013 року
МОДУЛЬ №3. "Аналіз часових рядів (time series)"
(24 акад. години)
Анотація: Аналіз вихідних даних на стаціонарність (Dickey Fuller, Augmented Dickey Fuller, Philips Perron). Лагові змінні, автокореляції. Проблема мультиколінеарності та гетероскедастичності, їх наслідки. Визначення типів тренда і сезонності в даних. Побудова моделей AR, MA, ARIMA і вибір кращої моделі. Особливості використання часових рядів у лінійній регресії. Прогнозування на основі часових рядів.
Програмне забезпечення: R
Програма:
o ARIMA (метод Бокса-Дженкінса) - 12 акад. годин
o Авторегресійні моделі AR
o Моделі змінного середнього MA
o Метод з авторегресії і ковзного середнього ARMA
o Метод ARIMA
o Сезонне розширення ARIMA
o Регресійний аналіз часових рядів - 12 акад. годин
o Види трендів, одиничний корінь
o Серійна кореляція
o Коінтеграція
Необхідні навички для участі: бажано спочатку пройти модуль ╧1, в іншому випадку потрібен досвід роботи з базами даних, знання одновимірного аналізу, лінійної регресії, розуміння основ роботи у R або впевнене користування будь-якими іншими статистичними пакетами*.
* Коди для практичної реалізації аналізу будуть надаватися у R.
Грудень 2013 року
МОДУЛЬ №4. "Аналіз виживаності (Survival analysis)"
(20 акад. годин)
Анотація: клас статистичних моделей, що дозволяють оцінити ймовірність настання події, наприклад, ймовірність смерті серед хворих або ймовірність механічної поломки. Модуль охоплює способи аналізу усічених (truncated) даних, що враховують час до настання певної події - "reliability analysis" у інженерії, "duration modeling" у економіці або "event history analysis" у соціології. Методи Каплана-Мейєра і Нельсона-Аалена та регресія Кокса.
Програмне забезпечення: R
Програма:
o Розподіл функції виживаності та функції ризику - 2 акад. години
o Тест Логранка - 2 акад. години
o Показники Каплана-Мейєра і Нельсона-Аалена - 2 акад. години
o Довірчі інтервали і бенди - 2 акад. година
o Регресія Кокса - 2 акад. години
o Діагностика регресії Кокса - 2 акад. години
o Аналіз конкуруючих ризиків - 2 акад. години
o Аналіз повторюваних подій - 2 акад. години
o Багатомірний час виживання - 2 акад. години
o Модель Кокса зі змінними, залежними від часу - 2 акад. години
Необхідні навички для участі: бажано спочатку пройти модуль ╧1, в іншому випадку потрібен досвід роботи з базами даних, знання одновимірного аналізу, лінійної або логістичної регресії, розуміння основ роботи у R або впевнене користування будь-якими іншими статистичними пакетами*.
* Коди для практичної реалізації аналізу будуть надаватися у R.
По завершенні кожного модуля видається сертифікат Вищої школи соціології при Інституті соціології НАН України. Вартість участі одного слухача в одному модулі 1200 грн., при участі у 4-х модулях - знижка 10, можлива оплата в кредит.
Реєстраційна картка учасника
Реєстрація за тел./факсом 044-255-60-56 або моб.067-503-03-76 або
e-mail: school@i-soc.org.ua