Открытый исходный код открыт для женщин?

Опубликовано: 2022-03-11

Следующее было опубликовано в преддверии запуска стипендий Toptal для женщин-разработчиков. Чтобы поддержать соискателей стипендии, Toptal также опубликовал руководство по внесению вашего первого вклада в открытый исходный код.

Женщины недостаточно представлены в сфере технологий. В этом осознании нет ничего нового. Просто посмотрите на цифры, опубликованные Facebook, Google, Intel, Slack и многими другими. Но цифры могут быть даже хуже, чем предполагают эти отчеты.

На недавнем мероприятии, посвященном технологиям, я услышал побочный разговор об отсутствии гендерного разнообразия в технологиях. Небольшая группа обсуждала тот факт, что, несмотря на то, что женщины составляют около 30% рабочей силы в сфере технологий, в инженерных командах более высокого уровня редко бывает больше нескольких женщин.

Один из участников этого разговора заметил, что это произошло потому, что разработчики-мужчины обычно более талантливы, чем разработчики-женщины. Никто в группе не возражал.

Хм…

Из личного опыта в Toptal и моего университетского опыта инженера в Принстоне, где было почти 50/50 мужчин и женщин, я знаю, что это ложь. Я работал с несколькими невероятными, очень умными женщинами-инженерами на самых разных должностях. Тем не менее, кажется, что цифры не соответствуют моему собственному опыту, особенно когда вы начинаете рассматривать более старшие инженерные должности.

И устранение этого неравенства очень важно. Это не просто разнообразие ради разнообразия. Если, согласно статистике, мужчины и женщины одинаково умны, то из десяти самых умных людей в мире пять должны быть мужчинами и пять женщинами. Таким образом, если ваша команда представляет собой что-то меньшее, чем равное соотношение мужчин и женщин, то ваша команда, вероятно, не самая лучшая, какой она может быть.

Если ваша команда представляет собой что-то меньшее, чем равный баланс мужчин и женщин, то ваша команда, вероятно, не самая лучшая, какой она может быть.

В идеальной системе разнообразие является вероятностным результатом. Но это не те результаты, которые мы наблюдаем.

Подслушав этот разговор, я хотел взглянуть на цифры, чтобы лучше понять, где и когда тенденции построения команд разработчиков программного обеспечения идут не так, как надо. Я искал в Google тренды гендерной разбивки по уровням навыков в области разработки программного обеспечения, но мне не удалось найти многого, поэтому я решил посмотреть общедоступные данные на GitHub. Я просмотрела 5000 профилей, чтобы получить имена, количество подписчиков, количество вкладов и количество репозиториев. Затем я использовал пакет с открытым исходным кодом гендеризовать.io, чтобы выяснить пол каждого профиля.

В этой первой партии было так мало женщин, что мне пришлось добавить больше данных, чтобы сделать даже простые графики значимыми, поэтому я наскреб еще 15 000 человек.

Вот что я нашел:

Насколько открытым является открытый исходный код для женщин?

Открытый исходный код открыт для женщин?
Твитнуть

В открытом исходном коде доминируют мужчины

Еще до того, как приступить к дальнейшему анализу, было очевидно, что процент женщин крайне низок. Из 20 000 профилей, genderize.io смог уверенно определить пол 15 374 человек. Из них только 6,0% (926) составляли женщины. Несоответствие становится более серьезным, когда вы начинаете смотреть на активность пользователей.

Возьмем 10 вкладов в качестве предела разницы между пользователем, который только что создал профиль и, возможно, немного поэкспериментировал, и тем, кто хотя бы углубился в проект с открытым исходным кодом или начал свой собственный. Результат: 5,4% женщин.

Всего 5,4% пользователей GitHub, сделавших более 10 публикаций из нашей случайной выборки, — женщины.
Твитнуть

На самом деле, если мы разделим пользователей на корзины в соответствии с их количеством вкладов (минимум 1000 пользователей в каждой корзине), процент пользователей-женщин будет уменьшаться по мере увеличения вкладов.

Мало того, что на GitHub гораздо меньше женщин, чем можно предположить по гендерному разнообразию в технологической индустрии, но похоже, что процент женщин уменьшается по мере увеличения активности пользователей.

Я продолжал копать, глядя на пол по количеству подписчиков и количеству репозиториев, и наблюдал ту же тенденцию. Особенно это было видно, если посмотреть на количество репозиториев:

Опять же, мы видим, что процент женщин уменьшается по мере того, как мы переходим к корзинам с большим количеством хранилищ.

Так что же здесь происходит? Является ли активность GitHub в первую очередь разумным показателем опыта программирования? (Я думаю, что да.) Талантливые инженеры-женщины менее склонны к активному участию в открытом коде, чем их коллеги-мужчины? Являются ли эти результаты еще одним индикатором проблем входа/удержания в технологической отрасли, когда речь идет о женщинах-инженерах?

Почему так мало участников сообщества Open Source?

Цифры для женщин в технологической индустрии уже довольно мрачные, но они еще хуже в проектах с открытым исходным кодом.

Многие предыдущие исследования были сосредоточены на причинах, по которым женщины не хотят заниматься предметами и карьерой, связанными с STEM. Некоторые делают вывод об общем отсутствии интереса к предметам STEM. Другие считают, что женщины отказываются от карьеры в сфере STEM после того, как на них накладывают стереотипы семья и учителя. Третьи ссылаются на отсутствие образцов для подражания или сочетание нескольких причин.

Согласно исследованию гендера в StackOverflow: «Вопрос гендера и предметов, связанных с STEM, изучался в течение нескольких лет, и в основном с точки зрения того, «почему» женщины не занимаются научными исследованиями или карьерой. До сих пор меньшее внимание уделялось количественной оценке феномена и представительства женщин в онлайн-сообществах (в качестве «пользователей» технологий), каковы уровни их участия и можно ли обнаружить различия на гендерном уровне. Были собраны только неподтвержденные данные о том, как определенные сообщества активно препятствуют участию женщин».

Но когда мы тратим так много времени на то, почему меньше женщин изучают предметы, связанные с STEM, мы упускаем из виду еще одно важное несоответствие: если 28% магистров компьютерных наук получают женщины, почему их число в сообществе открытого исходного кода так велико? ниже?

Есть несколько возможностей, которые следует учитывать при обдумывании ответа на этот вопрос:

1. Возможно, нет сильной корреляции между талантом программиста и активностью на GitHub.

В технологической отрасли многие разработчики обращаются к GitHub в начале своей карьеры, поскольку это обязательное условие для серьезного отношения к ним. Тем не менее, кажется, что все меньше женщин-разработчиков так относятся к открытому исходному коду. Возможно ли, что все эти данные случайны и мало что значат по сравнению с количеством талантливых женщин-программистов в технологической отрасли?

Я обсудил этот вопрос с двумя инженерами Toptal, Анной-Кьярой Беллини и Божидаром Бацовым. Анна-Кьяра имеет более чем 20-летний опыт разработки программного обеспечения в различных академических и деловых кругах, а Божидар занимает 98-е место в списке самых активных участников GitHub в мире.

Оба согласились, что, хотя активность на GitHub обычно является хорошим показателем инженерного опыта, обратное неверно, отметив, что они знают много отличных инженеров, которые вообще не связаны с открытым исходным кодом. Технологическая индустрия тоже согласна с тем, что многие компании оценивают профили GitHub во время процесса найма (хотя эта практика кажется довольно предвзятой, что неудивительно, учитывая результаты моего исследования).

Активность на GitHub, как правило, является хорошим индикатором инженерного мастерства, но обратное неверно… Многие замечательные инженеры не работают на GitHub.
Твитнуть

Божидар предположил, что разработчики ПО с открытым исходным кодом чаще всего относятся к тому типу людей, которые настаивают на больших внутренних изменениях в компании. Анна-Кьяра отметила, что для того, чтобы внести свой вклад в открытый исходный код, требуется большая уверенность, что, по ее мнению, женщинам-разработчикам может быть труднее преодолеть, учитывая плохую историю технической индустрии с гостеприимством женщин.

Конечно, есть несколько предубеждений, которые потенциально могут быть связаны с этими данными GitHub (включая тот факт, что почти 25% имен нельзя с уверенностью классифицировать как мужские/женские).

Однако Божидар, Анна-Киара и я согласились, что уровень активности на GitHub, как правило, является хорошим показателем опыта программирования. Тем не менее, эти данные свидетельствуют о том, что талантливые женщины-программисты предпочитают прекращать (или никогда не начинать) свои занятия открытым исходным кодом в пользу других вариантов.

2. Цифры, указанные в отчетах технологических компаний, включают не технические должности.

Многие компании в сфере высоких технологий утверждают, что у них работает от 25 до 30 процентов женщин. Однако эта цифра может ввести в заблуждение. Большинство из этих больших чисел — да, они самые большие — включают как технические, так и нетехнические роли.

Когда вы начнете изучать процент женщин-служащих на технических должностях, цифры упадут еще ниже.

В Facebook 32 процента сотрудников — женщины, но только 16 процентов технических должностей принадлежат женщинам. В Google наблюдается аналогичное снижение доли женщин с 30% в целом по компании до 18% на технических должностях. Slack падает с 39% женщин в целом до 18% среди инженеров. Из компаний, которые я исследовал, в Intel наблюдается наименьший скачок: с 24,1% женщин в целом до 19,4% на технических должностях.

Таким образом, несмотря на то, что во многих компаниях процент женщин-сотрудников составляет около четверти или даже трети компании, количество женщин на технических должностях на самом деле намного меньше. Кажется, более точным было бы утверждение о 15-20 процентах.

Но это по-прежнему оставляет огромное несоответствие между процентом женщин, занимающих технические или инженерные должности в технологических компаниях, и процентом женщин, которые участвуют в проектах с открытым исходным кодом на GitHub.

3. Женщины-программисты уходят из технологической индустрии.

Если активность на GitHub коррелирует со стажем работы и опытом, то чрезвычайно низкое количество активных женщин-участников (низкое даже по сравнению с общим числом женщин-участников) можно объяснить тревожно высоким уровнем ухода женщин-инженеров из технологической отрасли.

Среди женщин, которые присоединяются к индустрии высоких технологий, 56 процентов уходят в середине карьеры, что в два раза больше, чем среди мужчин.
Твитнуть

Если технологическая индустрия не сможет удержать столько женщин, прошедших середину карьеры, то вполне вероятно, что они также не будут участвовать во многих проектах с открытым исходным кодом.

Но эта линия рассуждений также вызывает вопрос: действительно ли корреляция между старшинством и вкладом верна? Многие частые участники OSS — относительно новые программисты, пытающиеся создать себе имя — так где же женщины из этой группы?

4. GitHub может быть неприветливым сообществом для женщин-программистов.

Комментируя статью о женщинах в сфере технологий, одна женщина-разработчик говорит: «Что касается проектов с открытым исходным кодом, я недавно об этом думала. На самом деле я ни к чему не стремился, и это определенно мешает моей карьере… Я чувствую, что это круг, в который я не могу попасть. Но больше всего я боюсь чрезмерного внимания к тому, что я единственная женщина-программист в общедоступном проекте. В свете того, как к женщинам относятся в Интернете, этот страх не кажется необоснованным».

Анна-Кьяра считает, что такие опасения являются общей темой среди женщин-инженеров, особенно когда речь идет об OSS. Когда я спросил ее, считает ли она, что женщины реже участвуют в проектах с открытым исходным кодом, она без колебаний ответила утвердительно.

Анна-Кьяра также упомянула о возможности того, что женщины-пользователи GitHub могут попытаться принять гендерно-нейтральное или мужское имя, чтобы гарантировать, что их будут воспринимать всерьез (помните, что genderize.io не смог уверенно определить пол примерно четверти пользователей). профили зачищены).

Однако это не означает, что женщин-участников нет. Бозидхар упоминает Exercism.io, популярный проект, начатый Катриной Оуэн, в котором участвуют несколько женщин. Он также упоминает Бодил Стокке, женщину-разработчика из Норвегии с чрезвычайно обширной историей популярных проектов с открытым исходным кодом.

Анна-Кьяра также предполагает, что, если в проекте есть женщины среди ведущих участников или руководителей, женщины-разработчики с большей вероятностью будут вносить в него свой вклад. К сожалению, по сравнению с количеством проектов, в которых доминируют мужчины, трудно найти проекты OSS, возглавляемые женщинами.

Но проблема больше, чем просто OSS. «Если подумать о женщинах, которых я знаю в сфере разработки, то это далеко не те 20%, о которых вы слышали в этих крупных компаниях. Я не думаю, что это даже близко к 10%», — говорит мне Анна-Кьяра. «Результат этого анализа GitHub меня не удивляет».

5. Неявные предубеждения, формирующие технологическую индустрию, могут просачиваться в GitHub.

Эрик Райс указывает на проблемы неявных предубеждений в технологической отрасли. Даже если отдельные люди внутри систем не предвзяты, этим системам очень легко стать предвзятыми. У людей также есть бессознательные предубеждения, что еще больше усложняет проблему.

В своей статье Эрик приводит пример оркестров, которые до 1970-х годов были преимущественно мужскими. Люди считали, что исполнители-мужчины обладают лучшими способностями к музыке, чем исполнители-женщины. Однако, как только оркестры начали отделять музыкантов от судей физическим экраном во время прослушиваний, цифры значительно изменились, и люди начали признавать, что мужчины и женщины в среднем играют одинаково хорошо.

Если подобные предубеждения проявляются в системах найма в технологической отрасли, это может помочь объяснить меньший процент женщин-разработчиков программного обеспечения, о котором я говорил ранее. И если будет нанимать меньше женщин-разработчиков программного обеспечения, эти эффекты могут просочиться в сообщества с открытым исходным кодом, такие как GitHub. Если кому-то отказывают в должности программиста на полный рабочий день, он может прийти к выводу, что он не так талантлив, и, следовательно, с меньшей вероятностью будет уверен в том, чтобы участвовать в проектах с открытым исходным кодом.

Где это оставляет нас?

Вот некоторые дополнительные вопросы, которые приходят мне в голову (и их гораздо больше):

1. Как эти цифры меняются со временем?

Привлечение большего числа женщин к участию в технологической индустрии является сейчас широко обсуждаемой темой, и рост числа учебных курсов по кодированию, требующих вклада, должен оказать положительное влияние, в том числе когда речь идет об открытом исходном коде. Насколько эффективны эти обсуждения и различные новые инициативы? Как бы выглядели эти цифры 3 года назад? 5 лет назад? А через год?

2. Как еще мы можем анализировать данные GitHub?

Анна-Кьяра предложила изучить гендерную разбивку пользователей на основе количества форков, которые у них есть, чтобы получить представление о том, как часто женщины-пользователи GitHub каким-то образом экспериментируют с проектом. Кроме того, есть и другие факторы, такие как возрастная группа, которые могут повлиять на наши выводы. Открытый исходный код долгое время был основным продуктом технологической индустрии, но GitHub был основан только в 2008 году.

3. Есть ли хороший способ узнать, какие пользователи GitHub используют вымышленное имя?

Если процент женщин, использующих вымышленное имя, намного выше, чем процент женщин на GitHub в целом, это будет очень сильным заявлением о том, насколько гостеприимным является GitHub (и технологии в целом, в определенной степени) как сообщество.

4. Как эти цифры меняются, когда вы начинаете смотреть на местоположение?

Это несовершенно, так как взаимодействие на GitHub теоретически не зависит от местоположения. Но можем ли мы чему-нибудь научиться у технических сообществ в странах, где доля женщин-пользователей GitHub выше среднего.

И вот несколько идей по улучшению этих цифр (опять же, их, конечно, гораздо больше):

1. Можно ли улучшить страницы популярных репозиториев GitHub?

Когда я обсуждал эту тему с Божидаром, он упомянул, что у большинства проектов/сообществ на GitHub есть лидеры, которые чрезвычайно терпеливы, приветливы и рады помочь новым участникам с открытым исходным кодом на ранних стадиях проекта. Кажется, это вовсе не общеизвестно (вспомните вышеупомянутый комментарий от женщины-разработчика, которая считала, что сообщества с открытым исходным кодом были «кругом, в который [она не могла] попасть»).

Знают ли новые пользователи GitHub, что этот тип наставничества и поддержки существует (при условии, что он настолько распространен, как он говорит), и знает ли новый пользователь, как легко найти такое руководство? Можно ли внести улучшения в интерфейсы популярных репозиториев GitHub, чтобы сделать их более очевидными и удобными? Например, если бы популярные страницы репозитория включали что-то вроде официальной роли «Наставник репозитория», может быть, было бы намного понятнее, если бы приветливый, опытный пользователь мог ответить на любые вопросы.

2. Публикуйте более качественные (и более распространенные) руководства «Начало работы с GitHub».

Существует множество постов, которые учат вас, как использовать GitHub, проводя вас через вытягивания/пуши, коммиты, ветвление и многое другое, но я почти ничего не нашел с точки зрения рекомендаций по взаимодействию в сообществе GitHub (если вы знаете о любой, пожалуйста, разместите соответствующие ссылки в комментариях).

Практическое руководство по этикету и передовым практикам сообщества GitHub в соответствии с вашим уровнем навыков может помочь разрушить элементы запугивания и привлечения внимания к вкладу в открытый исходный код. Это определенно то, что может побудить к участию новых начинающих разработчиков. Оставайтесь с нами для такого руководства от Toptal.

3. Больше наставничества может иметь огромное значение.

Божидар прокомментировал важность вовлеченных в проект разработчиков, которые были готовы помочь новичкам начать работу с основными задачами, а Анна-Кьяра рассказала, как может быть довольно пугающе прыгать в проект и открывать свою работу для критики. Кажется, что можно многое сделать, чтобы сделать сообщества с открытым исходным кодом более приветливыми для всех, включая женщин. Следите за инициативой Toptal и здесь!

Вы удивлены результатами GitHub? Как вы думаете, что они означают?