Поиск

Шаг второй: работа с полученными данными

Напомним, что на предыдущем мастер-классе из серии «DATA SCIENCE

» от педагога ДТ «Кванториум 42» Черной Анны Александровны участникам удалось определить критерии отбора данных, подобрать вопросы для анкетирования, создать форму для опроса покупателей.


Оказалось, что данные анкетирования содержат пропуски, ошибки и неправильно введенные данные. Прежде чем использовать, их необходимо привести к «нужному» виду: изменить тип данных, привести в бинарный или категориальный вид, заполнить пропуски или удалить строки. Трудность заключается в том, что иногда этих данных очень много и обработать вручную их невозможно.


На очередном мастер-классе, прошедшем 17 апреля участники познакомились с понятием нормализацией данных и получили первоначальные навыки использования библиотек Pandas и NumPy.


У ребят была возможность занять 2 позиции: быть наблюдателем или сразу опробовать свои действия в режиме реального времени, для чего им был предоставлен доступ к страницеJupyter Notebook с кодом и комментариями ссылка.


Итогом мастер-класса стал нормализованный набор данных, который будет использован на заключительном мастер-классе 24 апреля. Видео с мастер-класса можно посмотреть здесь


Напомним, что на заключительном из серии мастер-классе мы подведем итоги конкурса «Собери свой dataset» подробнее с информацией можно ознакомиться здесь



Просмотров: 14

Поиск

8 (3842) 38-10-85

(с 9:00 до 17:00)

650024, г. Кемерово, ул. Космическая, д. 8

 Детский технопарк "Кванториум 42" 

© 2018-2020

E-mail: kuztagis@mail.ru