Специалисты по данным: мифы против реальности

Опубликовано: 2018-04-05

Все, что быстро набирает обороты, имеет тенденцию становиться тем, о чем все говорят. И, чем больше люди о чем-то говорят, тем больше накапливается заблуждений и мифов. Наука о данных и аналитика — одна из таких областей, которая постоянно развивается, а вместе с ней растет и количество связанных мифов.

Сегодня мы собираемся развенчать некоторые из этих мифов и заблуждений, связанных с жизнью и работой специалистов по данным. Но прежде чем мы перейдем к этому, давайте сначала разберемся с типичным днем ​​из жизни специалиста по данным.

Специалист по данным

У организации есть куча данных, которые они собирали с течением времени из разных источников и в разных форматах. Теперь они решили что-то с этим сделать. Они хотят, чтобы их данные учитывались. К кому они обращаются?

Специалисты по данным!
Да, ученые данных, которых большинство путает с какими-то сверхъестественными существами. Эти люди составляют сердце и душу команды аналитиков данных любой организации. Они занимают важное положение, и хотя это может стать для вас неожиданностью, их обычный день очень похож на обычный день любого другого белого воротничка.

Оглавление

Встречи, встречи и еще раз встречи!

Исследователи данных должны посещать встречи, в основном ежедневно, для сбора требований, обсуждения проделанной работы и планирования работы на день. Есть также внутренние встречи, которые важны для организационных целей и решения деловых проблем. В целом, цель этих встреч — получить более четкое представление о существующих проблемах и убедиться, что все в организации понимают путь вперед.

Найдите данные и сделайте их чистыми!

Часть их дня уходит на выявление реальных проблем, с которыми сталкивается их организация, и поиск способов сделать свои данные полезными в решении этих проблем. Затем наступает более сложная часть — определение типа и источника необходимых данных. Опытный специалист по данным всегда выбирает данные из наиболее релевантных источников — тех, которые могут принести пользу.

Тем не менее, это то, что приходит с опытом и знаниями. Следовательно, специалистам по данным нужно тратить на это довольно много времени.

Однако сбор данных делает только половину работы. Специалист по данным также должен убедиться, что данные проверены и очищены. Если они работают с несовершенными данными, шансы на успех уменьшаются в геометрической прогрессии.

Основные основы статистики для науки о данных

Приступайте к магии. Мы имеем в виду аналитику.

Когда данные полностью очищены, специалист по данным тратит оставшееся время на выявление тенденций и закономерностей в данных. Это еще один проблемный аспект работы специалиста по данным, особенно потому, что не существует установленного метода для эффективного анализа этих данных. Чаще всего требуется, чтобы специалист по данным разрабатывал свои инструменты и алгоритмы или настраивал их с помощью существующих. Это требует непредвзятости и готовности экспериментировать.

Сплетите историю.

После анализа наборов данных следует самая важная часть — визуализация данных. Исследователи данных должны представить свои выводы перед аудиторией, которая в основном не связана с технологиями, например заинтересованными сторонами и маркетологами компании. Это не всегда ежедневная задача, но ее нужно делать часто, чтобы все было в движении. Значительная рабочая нагрузка специалиста по данным здесь включает в себя разработку метода визуализации, который не только фиксирует суть их данных, но и представляет все в эстетически приятной форме.

Роль специалиста по данным чрезвычайно динамична; для них не бывает двух одинаковых дней. Их работа заключается в том, чтобы они были в тонусе и всегда думали о своих мыслях. Данные, с которыми они работают, проблемы, которые они стремятся решить, и идеи, которые они ищут, постоянно меняются. Именно это делает роль ученого данных такой уникальной и захватывающей.

Руководство для начинающих по науке о данных и ее приложениям

А теперь сделайте шаг вперед и развенчайте еще больше таких, порой нелепых, мифов: видео

YouTube видео

Миф № 1: Вы должны быть опытным статистиком с докторской степенью. в статистике. Или, по крайней мере, у вас должно быть высшее статистическое образование.

Да, наличие формальной степени в области статистики гарантирует, что вы с первого дня освоите лучшие практики в области статистики. Однако придержите своих лошадей — если вы посмотрите на мир науки о данных, вы найдете больше людей из управленческий / не математический фон, чем у зависимых от математики «ученых-ракетчиков».

Миф № 2. Чтобы преуспеть в науке о данных, нужно быть хардкорным программистом. Чем хардкорнее, тем лучше.

Опять же, как и миф, который мы обсуждали всего пару строк назад, он тоже основан на ложном предположении о работе специалиста по данным. Люди предполагают, что быть специалистом по данным означает писать строки кода, алгоритмы и еще много чего! Но если вы обратили внимание на рутину, которую мы обсуждали ранее, вы поймете, что в ней нет никакого существенного «кодирования». Большинство алгоритмов или методов доступны в готовом виде, и требуется лишь небольшая настройка. Однако для этого нужно иметь логический склад ума.

Начните заниматься наукой о данных с помощью Python

Миф № 3. Специалисты по данным не являются учеными в полном смысле этого слова.

Каждый ученый по умолчанию является специалистом по данным. Чистая наука всегда сосуществовала с данными наблюдений. Без способности просеивать, сортировать, структурировать, классифицировать, теоретизировать и представлять свои данные ни один ученый не может внести согласованность в свои исследования. Точно так же специалист по данным, который не углубился в суть своих данных, не может эффективно представить свои выводы. Статистический контроль всегда был основой чистой науки, а теперь это основная обязанность специалиста по данным. Итак, если специалист по данным наблюдает за тенденциями и закономерностями в поведении клиентов организации и подтверждает свои выводы с помощью статистики и реальных экспериментов, он просто ученый.

Миф № 4: Специалисты по данным работают с дорогостоящими и сложными статистическими инструментами, чтобы выполнить свою работу.

По сути, работа специалиста по данным требует от него поиска скрытых тенденций и закономерностей в широком наборе данных. Для этого они могут использовать удобные инструменты визуализации, инструменты бизнес-аналитики с самостоятельным поиском, интерактивные инструменты исследования данных или даже простые инструменты, не требующие большого статистического мастерства. Просто добавим, что многие бизнес-аналитики со всего мира могут получить глубокие знания даже при моделировании функций в основном приложении для работы с электронными таблицами.

Миф № 5. Наука о данных — это передача данных в кластеры Hadoop и использование MapReduce. Простой!

Если бы люди пытались исследовать, прежде чем распространять мифы, нас бы здесь не было. Если вы поговорите с специалистом по данным, вы поймете, что наука о данных и аналитика — это гораздо больше, чем Hadoop и MapReduce. Это всего лишь два из многих инструментов. Чаще всего успешный проект по науке о данных использует множество инструментов на разных этапах. Следовательно, ожидается, что ученый данных будет в курсе любых крупных технологических достижений, происходящих в этой области, чтобы при необходимости соответствующим образом переключаться на любой инструмент или технологию. Когда дело доходит до науки о данных, один ботинок не подходит всем, и нет волшебной доски для спиритических сеансов, которая заставила бы духов науки о данных разговаривать с нами, смертными.

Лучшие шаги к освоению науки о данных, поверьте мне, я их пробовал

Мы надеемся, что вам понравилось расширять свое видение! Оставайтесь с нами; мы вернемся с большим количеством таких Mythbusters.

Является доктором философии. обязательно, чтобы стать Data Scientist?

Давайте разделим роль Data Scientist на две области, чтобы лучше понять это:

1. Роль прикладной науки о данных. Работа с текущими алгоритмами и понимание того, как они функционируют, является основным направлением прикладной науки о данных. Другими словами, все дело в том, чтобы включить эти методы в ваш проект. Большинство людей, связанных с карьерой Data Science, подпадают под эту категорию. Большинство вакансий и описаний работы обычно встречаются для этой роли.
2. Исследовательская роль. Если вы заинтересованы в исследовательской роли, вам может понадобиться докторская степень. Исследовательская роль в науке о данных включает создание новых алгоритмов с нуля, их исследование, написание научных статей и т. д.

Заменит ли искусственный интеллект специалистов по данным в ближайшем будущем?

В ходе эволюции науки о данных можно с уверенностью сказать, что искусственный интеллект в конечном итоге заменит операции, выполняемые специалистами по данным вручную. Однако компьютер не может сам решать, очищать ли данные, разрабатывать эффективную модель, работать над корректностью модели и т.д. Эти выборы делает тот, кто имеет необходимую квалификацию. Даже если предпринимаются попытки разработать более совершенные алгоритмы в надежде уменьшить потребность в специалистах по данным, вряд ли это произойдет в ближайшее время. Даже с самыми продвинутыми алгоритмами для поддержания функционирования фирм по-прежнему требуется кто-то со здравым смыслом и знанием предметной области.

Могу ли я стать Data Scientist, просто освоив инструменты Data Science?

Распространено заблуждение, что знание того, как использовать статистические инструменты и библиотеки, делает вас специалистом по данным. Работа с этими инструментами поможет вам лучше понять их, но наука о данных — это набор навыков, который сочетает в себе множество способностей. Изучение инструментов, которые идут с ним, — это только один аспект процесса. Наряду со знанием таких инструментов, как Python или R, жизненно важно освоить такие навыки, как решение проблем, глубокое понимание концепций и информацию о правильных приложениях, необходимых для решения бизнес-задач.