Что такое Data Science
Многие сводят термин «data science» к какому-то единому определению. Хотя любой специалист скажет вам, что конкретного определения вообще нет. Грубо говоря, это широкий и междисциплинарный концепт. Если говорить банально о переводе на русский, то мы получаем «науку о данных». Хотя профессионалы обычно так не выражаются. Они говорят «дата сайенс».
Если не углубляться в многочисленные нюансы, то перед вами пакет определенных взаимосвязанных дисциплин и методов, которые имеют отношение к таким сферам, как информатика и математика. Сегодня проводятся целые обучающие курсы по дата сайенс. Один из них, например, в Киеве datastream.pro. Но стоит понимать, что дата сайенс — это не так вещь, которой можно обучиться за один месяц и начать зарабатывать безумные деньги.
Начнем с 1-ой части — data. Без нее далее работать невозможно. Составляющая такой науки сводится к работе с информацией. Ее необходимо собирать, сохранять и обрабатывать. Так как информации огромный поток, нужно выделить самую драгоценную. К слову, очистка данных — это работа, которой специалистам из данной области приходится посвящать большую часть времени.
Что касаемо такого термина «big data» — его иногда сводят к «data science». На самом деле, здесь уместно говорить так — 1-ый подраздел 2-ого. Под «big data» подразумеваются данные колоссального объема, либо просто разнообразная информация. В таком случае не получается руководствоваться классическими способами обработки и хранения информации.
Когда данные собраны, необходимо переключаться ко второй части — то есть, «science». Ведь недостаточно собрать информацию, нужно ее корректным образом проанализировать, выбрать самые нужные закономерности и определить, как их задействовать. Для такой работы необходимы три дисциплины: это машинное обучение, статистика и оптимизация. Таким образом мы подходим к анализу данных. Благодаря машинному обучению выясняется, какие есть закономерности в существующих данных.
И все-таки не стоит строгим образом предполагать, что дата сайенс завершается, когда становятся ясными закономерности данных. Любой проект из данной серии можно смело назвать прикладным исследованием. Поэтому недопустимо игнорирование гипотез, планирования эксперимента. В конце концов, нужно оценить грамотным образом результат, определить его пригодность. Именно поэтому мы еще раз отмечаем, что наука — это не просто банальная обработка информации в самом простом смысле этого слова.
Другие новости по теме:
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.