- Регистрация
- 12.04.17
- Сообщения
- 19.095
- Реакции
- 107
- Репутация
- 0
В связи с карантином многие сейчас львиную долю времени проводят дома, и это время можно, и даже нужно провести с пользой.
В начале карантина я решил довести до ума некоторые проекты начатые несколько месяцев назад. Одним из таких проектов был видео курс "Язык R для пользователей Excel". Этим курсом я хотел снизить порог вхождения в R, и немного восполнить существующий дефицит обучающих материалов по данной теме на русском языке.
Если всю работу с данными в компании, в котороый вы работаете принято по-прежнему вести в Excel, то предлагаю вам познакомится с более современным, и при этом совершенно бесплатным инструментом анализа данных.
Содержание
Если вы интересуетесь анализом данных возможно вам будут интересны мои
Ссылки
О курсе
Курс построен вокруг архитектуры tidyverse, и входящих в неё пакетов: readr, vroom, dplyr, tidyr, ggplot2. Конечно в R есть и другие хорошие пакеты выполняющие подобные операции, например data.table, но синтаксис tidyverse интуитивно понятен, его легко читать даже неподготовленному пользователю, поэтому я думаю, что начинать обучение языку R лучше именно с tidyverse.
Курс проведёт вас через все операции анализа данных, от загрузки до визуализации готового результата.
Почему именно язык R, а не Python? Потому, что R функциональный язык, пользователям Excel на него перейти легче, т.к. не надо вникать в традиционное объектно-ориентированное программирование.
На данный момент запланировано 12 видео уроков длительностью от 5 до 20 минут каждый.
Уроки будут открываться постепенно. Каждый понедельник я буду открывать доступ к новому уроку у себя на
Для кого этот курс
Думаю это понятно из названия, тем не менее опишу более подробно.
Курс ориентирован на тех, кто в работе активно использует Micrisift Excel и там же реализует всю работу с данными. В общем, если вы открываете приложение Microsoft Excel хотя бы раз в неделю то курс вам подойдёт.
Навыков программирования для прохождения курса от вас не требуется, т.к. курс ориентирован на начинающих.
Но, возможно начиная с 4 урока найдётся материал интересный и для активных пользователей R, т.к. основной функционал таких пакетов как dplyr и tidyr будет рассмотрен достаточно подробно.
Программа курса
Урок 1: Установка языка R и среды разработки RStudio
Дата публикации: 23 марта 2020
Ссылки:
Описание:
Вступительный урок в ходе которого мы скачаем и установим необходимое программное обеспечение, и немного разберём возможности и интерфейс среды разработки RStudio.
Урок 2: Основные структуры данных в R
Дата публикации: 30 марта 2020
Ссылки:
Описание:
Этот урок поможет вам разобраться с тем, какие структуры данных есть в языке R. Мы подробно разберём векторы, дата фреймы и списки. Научимся их создавать и обращаться к их отдельным элементам.
Урок 3: Чтение данных из TSV, CSV, Excel файлов и Google Таблиц
Дата публикации: 6 апреля 2020
Ссылки:
Описание:
Работа с данными, не зависимо от инструмента, начинается с их добычи. В ходе урока используются пакеты vroom, readxl, googlesheets4 для загрузки данных в среду R из csv, tsv, Excel файлов и Google Таблиц.
Урок 4: Фильтрация строк, выбор и переименование столбцов, пайпланы в R
Дата публикации: 13 апреля 2020
Ссылки:
Описание:
Этот урок посвящён пакету dplyr. В нём мы разберёмся как фильтровать датафреймы, выбирать нужные столбцы и переименовывать их.
Также узнаем что такое пайпланы и как они помогают делать ваш код на языке R более читабельным.
Урок 5: Добавление вычисляемых столбцов в таблицу на языке R
Дата публикации: 20 апреля 2020
Ссылки:
Описание:
В этом видео мы продолжаем знакомство с библиотекой tidyverse и пакетом dplyr.
Разберём семейство функций mutate(), и научимся с их помощью добавлять в таблицу новые вычисляемые столбцы.
Урок 6: Группировка и агрегация данных на языке R
Дата публикации: 27 апреля 2020
Ссылки:
Описание:
Данный урок посвящён одной из основных операций анализа данных, группировке и агрегации. В ходе урока мы будем использовать пакет dplyr и функции group_by() и summarise().
Мы рассмотрим всё семейство функций summarise(), т.е. summarise(), summarise_if() и summarise_at().
Урок 7: Вертикальное и горизонтальное объединение таблиц на языке R
Дата публикации: 4 мая 2020
Ссылки:
Описание:
Этот урок поможет вам разобраться с операциями вертикального и горизонтального объединения таблиц.
Вертикальное объединение является аналогом операции UNION в языке запросов SQL.
Горизонтальное объединение пользователям Excel более известно благодаря функции ВПР, в SQL такие операции осуществляются оператором JOIN.
В ходе урока мы решим практическую задачу, в ходе которой будем использовать пакеты dplyr, readxl, tidyr и stringr.
Основные функции которые мы рассмотрим:
Урок 8: Оконные функции в R
Дата публикации: 11 мая 2020
Ссылки:
Описание:
Оконные функции по смыслу похожи на агрегирующие, они также принимают на вход массив значений и проводят над ними арифметические операции, но в исходящем результате не изменяют количество строк.
В этом уроке мы продолжаем изучать пакет dplyr, и функции group_by(), mutate(), а также новые cumsum(), lag(), lead() и arrange().
Урок 9: Вращение таблиц или аналог сводных таблиц в R
Дата публикации: 18 мая 2020
Ссылки:
Описание:
Большинство пользователей Excel используют сводные таблицы, это удобный инструмент с помощью которого вы можете в считанные секунды превратить массив сырых данных в читабельные отчёты.
В этом уроке мы разберёмся с тем как вращать таблицы в R, и преобразовывать их из широко формата в длинный и наоборот.
Большая часть урока посвящена пакету tidyr и функциям pivot_longer() и pivot_wider().
Урок 10: Загрузка JSON файлов в R и преобразование списков в таблицы
Дата публикации: 25 мая 2020
Ссылки:
Описание:
JSON и XML являются чрезвычайно популярными форматами хранения и обмена информацией, как правило, за счёт своей компактности.
Но анализировать данные представленные в таких форматах сложно, поэтому их перед анализом необходимо привести к табличному виду, именно этому мы и научимся в данном видео.
Урок посвящён пакету tidyr, входящему в ядро библиотеки tidyverse, и функциям unnest_longer(), unnest_wider() и hoist().
Урок 11: Быстрое построение графиков с помощью функции qplot()
Дата публикации: 1 июня 2020
Ссылки:
Описание:
Пакет ggplot2 является одним из наиболее популярных средств визуализации данных не только в R.
В этом уроке мы научимся построению простейших графиков с помощью функции qplot(), и разберём все её аргументы.
Урок 12: Построение графиков слой за слоем с помощью пакета ggplot2
Дата публикации: 8 июня 2020
Ссылки:
Описание:
В уроке продемонстрирована вся мощь пакета ggplot2 и заложенной в него грамматики построения графиков слоями.
Мы разберём основные геометрии которые присутствуют в пакете и научимся накладывать слои для построения графика.
Заключение
Я старался подойти к формированию программы курса максимально лаконично, выделить только самую необходимую информацию которая понадобится вам для того, что бы сделать первые шаги в изучении такого мощного инструмента анализа данных как язык R.
Курс не является исчерпывающим руководством по анализу данных с помощью языка R, но поможет вам разобраться со всеми необходимыми для этого приёмами.
Пока программа курса рассчитана на 12 недель, каждую неделю, по понедельникам я буду открывать доступ к новым урокам, поэтому рекомендую
В начале карантина я решил довести до ума некоторые проекты начатые несколько месяцев назад. Одним из таких проектов был видео курс "Язык R для пользователей Excel". Этим курсом я хотел снизить порог вхождения в R, и немного восполнить существующий дефицит обучающих материалов по данной теме на русском языке.
Если всю работу с данными в компании, в котороый вы работаете принято по-прежнему вести в Excel, то предлагаю вам познакомится с более современным, и при этом совершенно бесплатным инструментом анализа данных.

Содержание
Если вы интересуетесь анализом данных возможно вам будут интересны мои
You must be registered for see links
и
You must be registered for see links
каналы. Большая часть контента которых посвящены языку R.-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
4.1.You must be registered for see links
4.2.You must be registered for see links
4.3.You must be registered for see links
4.4.You must be registered for see links
4.5.You must be registered for see links
4.6.You must be registered for see links
4.7.You must be registered for see links
4.8.You must be registered for see links
4.9.You must be registered for see links
4.10.You must be registered for see links
4.11.You must be registered for see links
4.12.You must be registered for see links -
You must be registered for see links
Ссылки
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
О курсе
Курс построен вокруг архитектуры tidyverse, и входящих в неё пакетов: readr, vroom, dplyr, tidyr, ggplot2. Конечно в R есть и другие хорошие пакеты выполняющие подобные операции, например data.table, но синтаксис tidyverse интуитивно понятен, его легко читать даже неподготовленному пользователю, поэтому я думаю, что начинать обучение языку R лучше именно с tidyverse.
Курс проведёт вас через все операции анализа данных, от загрузки до визуализации готового результата.
Почему именно язык R, а не Python? Потому, что R функциональный язык, пользователям Excel на него перейти легче, т.к. не надо вникать в традиционное объектно-ориентированное программирование.
На данный момент запланировано 12 видео уроков длительностью от 5 до 20 минут каждый.
Уроки будут открываться постепенно. Каждый понедельник я буду открывать доступ к новому уроку у себя на
You must be registered for see links
в отдельном плей листе.Для кого этот курс
Думаю это понятно из названия, тем не менее опишу более подробно.
Курс ориентирован на тех, кто в работе активно использует Micrisift Excel и там же реализует всю работу с данными. В общем, если вы открываете приложение Microsoft Excel хотя бы раз в неделю то курс вам подойдёт.
Навыков программирования для прохождения курса от вас не требуется, т.к. курс ориентирован на начинающих.
Но, возможно начиная с 4 урока найдётся материал интересный и для активных пользователей R, т.к. основной функционал таких пакетов как dplyr и tidyr будет рассмотрен достаточно подробно.
Программа курса
Урок 1: Установка языка R и среды разработки RStudio
Дата публикации: 23 марта 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
Описание:
Вступительный урок в ходе которого мы скачаем и установим необходимое программное обеспечение, и немного разберём возможности и интерфейс среды разработки RStudio.
Урок 2: Основные структуры данных в R
Дата публикации: 30 марта 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
Этот урок поможет вам разобраться с тем, какие структуры данных есть в языке R. Мы подробно разберём векторы, дата фреймы и списки. Научимся их создавать и обращаться к их отдельным элементам.
Урок 3: Чтение данных из TSV, CSV, Excel файлов и Google Таблиц
Дата публикации: 6 апреля 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
Работа с данными, не зависимо от инструмента, начинается с их добычи. В ходе урока используются пакеты vroom, readxl, googlesheets4 для загрузки данных в среду R из csv, tsv, Excel файлов и Google Таблиц.
Урок 4: Фильтрация строк, выбор и переименование столбцов, пайпланы в R
Дата публикации: 13 апреля 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
Этот урок посвящён пакету dplyr. В нём мы разберёмся как фильтровать датафреймы, выбирать нужные столбцы и переименовывать их.
Также узнаем что такое пайпланы и как они помогают делать ваш код на языке R более читабельным.
Урок 5: Добавление вычисляемых столбцов в таблицу на языке R
Дата публикации: 20 апреля 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
В этом видео мы продолжаем знакомство с библиотекой tidyverse и пакетом dplyr.
Разберём семейство функций mutate(), и научимся с их помощью добавлять в таблицу новые вычисляемые столбцы.
Урок 6: Группировка и агрегация данных на языке R
Дата публикации: 27 апреля 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
Данный урок посвящён одной из основных операций анализа данных, группировке и агрегации. В ходе урока мы будем использовать пакет dplyr и функции group_by() и summarise().
Мы рассмотрим всё семейство функций summarise(), т.е. summarise(), summarise_if() и summarise_at().
Урок 7: Вертикальное и горизонтальное объединение таблиц на языке R
Дата публикации: 4 мая 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
Этот урок поможет вам разобраться с операциями вертикального и горизонтального объединения таблиц.
Вертикальное объединение является аналогом операции UNION в языке запросов SQL.
Горизонтальное объединение пользователям Excel более известно благодаря функции ВПР, в SQL такие операции осуществляются оператором JOIN.
В ходе урока мы решим практическую задачу, в ходе которой будем использовать пакеты dplyr, readxl, tidyr и stringr.
Основные функции которые мы рассмотрим:
- bind_rows() — вертикальное объединение таблиц
- left_join() — горизонтальное объединение таблиц
- semi_join() — включающее объединение таблиц
- anti_join() — исключающее объединение таблиц
Урок 8: Оконные функции в R
Дата публикации: 11 мая 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
Оконные функции по смыслу похожи на агрегирующие, они также принимают на вход массив значений и проводят над ними арифметические операции, но в исходящем результате не изменяют количество строк.
В этом уроке мы продолжаем изучать пакет dplyr, и функции group_by(), mutate(), а также новые cumsum(), lag(), lead() и arrange().
Урок 9: Вращение таблиц или аналог сводных таблиц в R
Дата публикации: 18 мая 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
Большинство пользователей Excel используют сводные таблицы, это удобный инструмент с помощью которого вы можете в считанные секунды превратить массив сырых данных в читабельные отчёты.
В этом уроке мы разберёмся с тем как вращать таблицы в R, и преобразовывать их из широко формата в длинный и наоборот.
Большая часть урока посвящена пакету tidyr и функциям pivot_longer() и pivot_wider().
Урок 10: Загрузка JSON файлов в R и преобразование списков в таблицы
Дата публикации: 25 мая 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
JSON и XML являются чрезвычайно популярными форматами хранения и обмена информацией, как правило, за счёт своей компактности.
Но анализировать данные представленные в таких форматах сложно, поэтому их перед анализом необходимо привести к табличному виду, именно этому мы и научимся в данном видео.
Урок посвящён пакету tidyr, входящему в ядро библиотеки tidyverse, и функциям unnest_longer(), unnest_wider() и hoist().
Урок 11: Быстрое построение графиков с помощью функции qplot()
Дата публикации: 1 июня 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
Пакет ggplot2 является одним из наиболее популярных средств визуализации данных не только в R.
В этом уроке мы научимся построению простейших графиков с помощью функции qplot(), и разберём все её аргументы.
Урок 12: Построение графиков слой за слоем с помощью пакета ggplot2
Дата публикации: 8 июня 2020
Ссылки:
-
You must be registered for see links
-
You must be registered for see links
Описание:
В уроке продемонстрирована вся мощь пакета ggplot2 и заложенной в него грамматики построения графиков слоями.
Мы разберём основные геометрии которые присутствуют в пакете и научимся накладывать слои для построения графика.
Заключение
Я старался подойти к формированию программы курса максимально лаконично, выделить только самую необходимую информацию которая понадобится вам для того, что бы сделать первые шаги в изучении такого мощного инструмента анализа данных как язык R.
Курс не является исчерпывающим руководством по анализу данных с помощью языка R, но поможет вам разобраться со всеми необходимыми для этого приёмами.
Пока программа курса рассчитана на 12 недель, каждую неделю, по понедельникам я буду открывать доступ к новым урокам, поэтому рекомендую
You must be registered for see links
на YouTube канал, что бы не пропустить публикацию нового урока.