Czy Open Source jest otwarte dla kobiet?
Opublikowany: 2022-03-11Poniższe informacje zostały opublikowane przed uruchomieniem stypendiów Toptal dla programistek. Aby wesprzeć osoby ubiegające się o stypendia, Toptal opublikował również przewodnik po dokonaniu pierwszego wkładu open source.
Kobiety są niedostatecznie reprezentowane w technologii. Ta świadomość nie jest niczym nowym. Wystarczy spojrzeć na liczby opublikowane przez Facebook, Google, Intel, Slack i wiele, wiele innych. Ale liczby mogą być nawet gorsze, niż sugerują te raporty.
Podczas niedawnego wydarzenia technologicznego podsłuchałem rozmowę poboczną na temat braku różnorodności płci w technologii. Mała grupa dyskutowała o tym, że chociaż kobiety stanowią około 30% siły roboczej w branży technologicznej, zespoły inżynierskie wyższego szczebla rzadko mają więcej niż kilka kobiet.
Jeden z uczestników tej rozmowy skomentował, że dzieje się tak, ponieważ programiści płci męskiej są ogólnie bardziej utalentowani niż programiści. Nikt z grupy nie sprzeciwił się.
Hmm…
Z własnego doświadczenia w Toptal i mojego uniwersyteckiego doświadczenia w inżynierii w Princeton, gdzie prawie 50/50 mężczyzn kontra kobiety, wiem, że to nieprawda. Pracowałam z wieloma niesamowitymi, niezwykle inteligentnymi inżynierami na różnych stanowiskach. Jednak liczby wydają się nie pasować do mojego własnego doświadczenia, zwłaszcza gdy zaczynasz patrzeć na wyższe stanowiska inżynierskie.
Ważne jest zajęcie się tą rozbieżnością. To nie tylko różnorodność ze względu na różnorodność. Jeśli mężczyźni i kobiety są statystycznie jednakowo inteligentni, to z dziesięciu najmądrzejszych ludzi na świecie pięciu powinno być mężczyznami, a pięć kobiet. Tak więc, jeśli twój zespół jest mniej niż równy równowagą mężczyzn i kobiet, to prawdopodobnie nie jest najlepszy, jaki może być.
W idealnym systemie różnorodność jest wynikiem probabilistycznym. Ale to nie są wyniki, które widzimy.
Po podsłuchaniu tej rozmowy chciałem przyjrzeć się liczbom, aby lepiej zrozumieć, czy/gdzie tendencje do budowania zespołu programistycznego idą źle. Szukałem w Google trendów w podziale płci na różne poziomy umiejętności w inżynierii oprogramowania, ale nie mogłem znaleźć zbyt wiele, więc postanowiłem przyjrzeć się publicznie dostępnym danym na GitHub. Zebrałem 5000 profili, aby uzyskać nazwiska, liczbę obserwujących, liczbę wkładów i liczbę repozytoriów. Następnie użyłem pakietu open source genderize.io, aby ustalić płeć każdego profilu.
W tej pierwszej partii było tak mało kobiet, że musiałem dodać więcej danych, aby nawet proste wykresy były znaczące, więc zebrałem 15 000 więcej.
Oto, co znalazłem:
Open Source jest zdominowany przez mężczyzn
Jeszcze przed przystąpieniem do dalszych analiz było oczywiste, że odsetek kobiet był niezwykle niski. Spośród 20 000 profili, genderize.io było w stanie bez obaw określić płeć 15 374. Spośród nich zaledwie 6,0% (926) stanowiły kobiety. Rozbieżność pogłębia się, gdy zaczniesz przyglądać się aktywności użytkowników.
Weźmy 10 wkładów jako granicę różnicy między użytkownikiem, który właśnie utworzył profil i być może trochę poeksperymentował, a takim, który przynajmniej zagłębił się w projekt open source lub założył własny. Wynik: 5,4% kobiet.
W rzeczywistości, jeśli podzielimy użytkowników na grupy według liczby ich wkładów (z co najmniej 1000 użytkowników w każdym przedziale), odsetek kobiet ma tendencję do zmniejszania się wraz ze wzrostem wkładów.
Nie tylko jest znacznie mniej kobiet na GitHub, niż mogłoby to sugerować dane dotyczące różnorodności płci w branży technologicznej, ale wygląda na to, że odsetek kobiet spada wraz ze wzrostem aktywności użytkowników.
Kopałem dalej, patrząc na płeć pod kątem liczby obserwujących i liczby repozytoriów, i zaobserwowałem ten sam trend. Było to szczególnie widoczne, patrząc na liczbę repozytoriów:
Ponownie widzimy, że odsetek kobiet zmniejsza się, gdy przechodzimy do grup z większą liczbą repozytoriów.
Więc co się tutaj dzieje? Czy aktywność na GitHubie jest przede wszystkim rozsądnym wskaźnikiem wiedzy programistycznej? (Myślę, że tak.) Czy utalentowane inżynierki są mniej skłonne do aktywnego wkładu w open source niż ich koledzy? Czy te wyniki są kolejnym wskaźnikiem problemów z wejściem/utrzymaniem ruchu w branży technologicznej, jeśli chodzi o kobiety-inżynierów?
Dlaczego liczby w społeczności Open Source są tak niskie?
Liczby kobiet w branży technologicznej są już dość ponure, ale w projektach open source są jeszcze gorsze.
Wiele wcześniejszych badań koncentrowało się na powodach, dla których kobiety nie są skłonne do podejmowania tematów i karier związanych z STEM. Niektórzy stwierdzają ogólny brak zainteresowania przedmiotami STEM. Inni uważają, że kobiety rezygnują z robienia kariery w STEM po tym, jak są stereotypowe przez rodzinę i nauczycieli. Jeszcze inni przytaczają brak wzorów do naśladowania lub połączenie wielu przyczyn.
Według badania dotyczącego płci w StackOverflow: „Kwestia płci i przedmiotów związanych z STEM była badana od kilku lat i głównie z punktu widzenia „dlaczego” kobiety nie angażują się w studia naukowe lub kariery. Do tej pory mniej uwagi poświęcono ilościowemu określeniu zjawiska i reprezentacji kobiet w społecznościach internetowych (jako „użytkowników technologii”), jakie są ich poziomy uczestnictwa i czy różnice można wykryć na poziomie płci. Zebrano tylko niepotwierdzone dowody na to, jak konkretne społeczności aktywnie zniechęcają kobiety do udziału”.
Ale kiedy spędzamy tak dużo czasu, skupiając się na tym, dlaczego mniej kobiet zajmuje się tematami związanymi z STEM, tracimy uwagę na innej ważnej rozbieżności: jeśli 28% tytułów magisterskich CS trafia do kobiet, dlaczego liczba w społeczności open source jest tak duża niżej?
Myśląc o odpowiedzi na to pytanie, warto rozważyć kilka możliwości:
1. Może nie ma silnej korelacji między talentem programistycznym a aktywnością na GitHubie.
W branży technologicznej wielu programistów odwiedza GitHub na początku swojej kariery, ponieważ jest to warunek wstępny, który należy traktować poważnie. Wydaje się jednak, że mniej ambitnych programistek postrzega w ten sposób open source. Czy to możliwe, że te dane są przypadkowe i niewiele znaczą w stosunku do liczby utalentowanych kobiet inżynierów oprogramowania w branży technologicznej?
Omówiłem to pytanie z dwoma inżynierami z Toptal, Anną-Chiarą Bellini i Bozhidarem Batsowem. Anna-Chiara ma ponad 20-letnie doświadczenie w inżynierii oprogramowania w różnych środowiskach akademickich i biznesowych, a Bozhidar zajmuje 98. miejsce na liście najbardziej aktywnych współtwórców GitHub na świecie.
Obaj zgodzili się, że chociaż aktywność na GitHubie jest zazwyczaj dobrym wskaźnikiem wiedzy inżynierskiej, nie jest to prawdą, wspominając, że znają wielu świetnych inżynierów, którzy w ogóle nie są zaangażowani w open source. Branża technologiczna również się zgadza, ponieważ wiele firm ocenia profile GitHub podczas procesów rekrutacyjnych (chociaż ta praktyka wydaje się dość stronnicza, co nie jest zaskoczeniem, biorąc pod uwagę wyniki mojego badania).
Bozhidar zasugerował, że współtwórcy oprogramowania open source są często bardziej skłonni do tego typu ludzi, którzy naciskają na duże wewnętrzne zmiany w otoczeniu firmy. Anna-Chiara skomentowała, że wkładanie w open source wymaga dużej pewności, co jej zdaniem może być trudniejsze do przezwyciężenia dla kobiet-programistów, biorąc pod uwagę słabą historię branży technologicznej w zakresie przyjmowania kobiet.
Z pewnością istnieje kilka błędów, które potencjalnie mogą mieć wpływ na te dane GitHub (w tym fakt, że prawie 25% nazw nie może być z pewnością sklasyfikowane jako męskie/żeńskie).
Jednak Bozhidar, Anna-Chiara i ja zgodziliśmy się, że poziom aktywności GitHub jest ogólnie dobrym wskaźnikiem wiedzy programistycznej. Jednak te dane wskazują na trend, w którym utalentowane programistki decydują się przerwać (lub nigdy nie rozpocząć) swoich poszukiwań open source na rzecz innych opcji.
2. Liczby cytowane w raportach firm technologicznych obejmują role niezwiązane z technologią.
Wiele firm z branży technologicznej podaje, że zatrudnia od 25 do 30 proc. kobiet. Ta liczba może jednak wprowadzać w błąd. Większość z tych większych liczb – tak, są to większe liczby – obejmuje zarówno role techniczne, jak i nietechniczne.
Gdy zaczniesz badać odsetek kobiet zatrudnionych na stanowiskach technicznych, liczby te spadają jeszcze niżej.
Na Facebooku 32 procent pracowników to kobiety, ale tylko 16 procent stanowisk technicznych należy do kobiet. W Google mamy do czynienia z podobnym spadkiem o 30 proc. kobiet zatrudnionych w całej firmie do 18 proc. na stanowiskach technicznych. Slack spada z 39 procent kobiet do 18 procent na stanowiskach inżynierskich. Spośród firm, które przebadałem, Intel odnotował najmniejszy skok, z 24,1 procent ogółem kobiet do 19,4 procent na stanowiskach technicznych.

Tak więc, mimo że wiele firm może pochwalić się procentem zatrudnionych kobiet, który stanowi około jednej czwartej lub nawet jednej trzeciej firmy, liczba kobiet na stanowiskach technicznych jest w rzeczywistości znacznie niższa. Wydaje się, że twierdzenia na poziomie 15 do 20 procent byłyby bardziej trafne.
Ale to wciąż pozostawia ogromną dysproporcję między odsetkiem kobiet zaangażowanych w role techniczne lub inżynierskie w firmach technologicznych a odsetkiem kobiet, które przyczyniają się do projektów open source na GitHub.
3. Programistki odchodzą z branży technologicznej.
Jeśli aktywność na GitHubie koreluje ze stażem pracy i doświadczeniem, to niezwykle niską liczbę aktywnych współpracowników (niską nawet w porównaniu do ogólnej liczby kobiet) można wytłumaczyć alarmująco wysokim wskaźnikiem odejść kobiet-inżynierów z branży technologicznej.
Jeśli branża technologiczna nie jest w stanie zatrzymać tylu kobiet, które przeszły już w połowie kariery, prawdopodobnie nie będą też przyczyniać się do wielu projektów open source.
Ale ten tok rozumowania nasuwa również pytanie: czy korelacja między stażem pracy a wkładem jest rzeczywiście prawdziwa? Wielu częstych współpracowników OSS to stosunkowo nowi programiści, którzy próbują wypracować sobie markę - więc gdzie są kobiety z tej grupy?
4. GitHub może być nieprzyjazną społecznością dla programistek.
Komentując artykuł o kobietach w branży technologicznej, jedna z programistek mówi: „W odniesieniu do projektów open source – ostatnio o tym myślałam. Właściwie nie zobowiązałem się do żadnego i zdecydowanie wpłynęło to na moją karierę… Czuję, że to krąg, do którego nie mogę się dostać. Ale przede wszystkim obawiam się nadmiernego skupienia uwagi na byciu jedyną kobietą programistką w publicznie dostępnym projekcie. W świetle tego, jak kobiety są traktowane w Internecie, ten strach nie wydaje się nieuzasadniony”.
Anna-Chiara uważa, że tego rodzaju obawy są powszechnym tematem wśród kobiet-inżynierów, zwłaszcza jeśli chodzi o OSS. Kiedy zapytałem ją, czy uważa, że kobiety są mniej skłonne do udziału w projektach open source, bez wahania odpowiedziała, że tak.
Anna-Chiara wspomniała również o możliwości, że użytkownicy GitHub mogą próbować przyjąć imię neutralne pod względem płci lub męskie, aby mieć pewność, że zostaną potraktowane poważnie (pamiętaj, że genderize.io nie było w stanie z całą pewnością określić płci około jednej czwartej profile zeskrobane).
Nie oznacza to jednak, że nie ma tam współpracowników. Bozidhar przywołuje Exercism.io, popularny projekt zapoczątkowany przez Katrinę Owen, w którym bierze udział kilka kobiet. Wspomina również Bodil Stokke, programistkę z Norwegii z niezwykle bogatą historią popularnych wkładów open source.
Anna-Chiara sugeruje również, że jeśli w projekcie znalazłyby się kobiety wśród najlepszych współtwórców lub liderów, kobiety-deweloperzy mogą mieć większy wkład w jego realizację. Niestety, w porównaniu z liczbą projektów zdominowanych przez mężczyzn, trudno znaleźć projekty OSS kierowane przez kobiety.
Ale problem jest większy niż tylko OSS. „Jeśli pomyślę o kobietach, które znam, zajmujących się rozwojem, nie zbliżam się do 20%, o których słyszy się w tych dużych firmach. Nie sądzę, żeby było to nawet blisko 10%” – mówi mi Anna-Chiara. „Wynik tej analizy GitHub mnie nie zaskakuje”.
5. Ukryte uprzedzenia, które kształtują branżę technologiczną, mogą przenikać do GitHub.
Eric Ries zwraca uwagę na problemy związane z niejawnymi uprzedzeniami w branży technologicznej. Nawet jeśli poszczególni ludzie w systemach nie są stronniczy, nadal bardzo łatwo jest tym systemom stać się stronniczymi. Ludzie mają również nieświadome uprzedzenia, co jeszcze bardziej komplikuje sprawę.
W swoim artykule Eric posługuje się przykładem orkiestr, które do lat 70. były głównie męskie. Ludzie wierzyli, że wykonawcy płci męskiej mają wyższe uzdolnienia muzyczne niż wykonawcy płci żeńskiej. Jednak gdy orkiestry zaczęły oddzielać muzyków od sędziów za pomocą fizycznego ekranu podczas przesłuchań, liczby znacznie się zmieniły, a ludzie zaczęli akceptować, że mężczyźni i kobiety grają średnio równie dobrze.
Jeśli podobne uprzedzenia wejdą w grę w systemach zatrudniania w branży technologicznej, może to pomóc wyjaśnić mniejszy odsetek kobiet inżynierów oprogramowania, o którym wspomniałem wcześniej. A jeśli zatrudnionych zostanie mniej kobiet inżynierów oprogramowania, efekty te mogą przedostać się do społeczności open source, takich jak GitHub. Jeśli ktoś zostanie odrzucony na pełnoetatowe stanowiska programistyczne, może uwierzyć, że nie jest tak utalentowany, a zatem będzie mniej skłonny do wnoszenia wkładu w projekty open source.
Gdzie nas to zostawia?
Oto kilka pytań uzupełniających, które przychodzą mi do głowy (a jest ich o wiele więcej):
1. Jak te liczby zmieniają się w czasie?
Zaangażowanie większej liczby kobiet w branżę technologiczną jest obecnie szeroko dyskutowanym tematem, a wzrost liczby bootcampów dotyczących kodowania, które wymagają wkładu, powinien mieć pozytywny wpływ, w tym jeśli chodzi o open source. Jak skuteczne są te dyskusje i różne nowe inicjatywy? Jak wyglądałyby te liczby 3 lata temu? 5 lat temu? A co za rok?
2. Jak jeszcze możemy analizować dane GitHub?
Anna-Chiara zasugerowała zbadanie podziału użytkowników według płci na podstawie liczby forków, które muszą mieć, aby zorientować się, jak często użytkownicy GitHub płci żeńskiej w jakiś sposób eksperymentują z projektem. Dodatkowo, w grę wchodzą inne czynniki, takie jak grupa wiekowa, które mogą wpływać na nasze ustalenia. Open source od dawna jest podstawą branży technologicznej, ale GitHub został założony dopiero w 2008 roku.
3. Czy istnieje dobry sposób na sprawdzenie, którzy użytkownicy GitHub używają fałszywej nazwy?
Jeśli odsetek kobiet, które używają fałszywej nazwy, jest znacznie wyższy niż ogólny odsetek kobiet na GitHubie, byłoby to bardzo mocne stwierdzenie, jak bardzo przyjazny jest GitHub (i w pewnym stopniu ogólnie technologia) jako społeczność.
4. Jak zmieniają się te liczby, gdy zaczynasz patrzeć na lokalizację?
Jest to niedoskonałe, ponieważ interakcja na GitHubie jest teoretycznie niezależna od lokalizacji. Ale czy możemy się czegoś nauczyć od społeczności technicznych w krajach, w których odsetek kobiet korzystających z GitHub jest wyższy niż przeciętny.
A oto kilka pomysłów na ulepszenie tych liczb (znów jest ich oczywiście dużo więcej):
1. Czy można ulepszyć strony popularnych repozytoriów GitHub?
Kiedy omawiałem ten temat z Bozhidarem, wspomniał, że większość projektów/społeczności na GitHub ma liderów, którzy są niezwykle cierpliwi, gościnni i szczęśliwi, prowadząc nowych współtwórców open source przez wczesne etapy projektu. Wydaje się, że to wcale nie jest powszechna wiedza (przypomnij sobie wspomniany wcześniej komentarz pewnej programistki, która uważała, że społeczności open source są „kręgiem, do którego nie mogła się dostać”).
Czy nowi użytkownicy GitHub są świadomi istnienia tego rodzaju mentoringu i wsparcia (zakładając, że są one tak powszechne, jak mówi) i czy nowy użytkownik wiedziałby, jak łatwo znaleźć takie wskazówki? Czy można wprowadzić ulepszenia w interfejsach popularnych repozytoriów GitHub, aby uczynić to bardziej oczywistym i bardziej przyjaznym? Na przykład, gdyby popularne strony repozytoriów zawierały coś w rodzaju oficjalnej roli „mentora repozytorium”, być może byłoby znacznie jaśniejsze, gdyby przyjazny, doświadczony użytkownik był dostępny, aby odpowiedzieć na wszelkie pytania.
2. Publikuj lepsze (i bardziej rozpowszechnione) przewodniki „Pierwsze kroki z GitHub”.
Istnieje wiele postów, które uczą Cię, jak korzystać z GitHub, prowadząc Cię przez pull/push, commits, branching i nie tylko, ale nie znajduję prawie niczego, jeśli chodzi o wytyczne dotyczące interakcji w społeczności GitHub (jeśli wiesz o dowolny, proszę zamieścić odpowiednie linki w komentarzach).
Poradnik dotyczący poruszania się po etykiecie społeczności GitHub i najlepszych praktykach zgodnie z Twoim poziomem umiejętności może pomóc w przełamaniu elementów zastraszania i zwracania uwagi na wkład w open source. Jest to z pewnością coś, co mogłoby zachęcić bardziej ambitnych nowych programistów do zaangażowania się. Czekajcie na taki przewodnik od Toptal.
3. Więcej mentoringu może zrobić ogromną różnicę.
Bozhidar skomentował znaczenie programistów zaangażowanych w projekt, którzy byli gotowi pomóc nowicjuszom w rozpoczęciu podstawowych zadań, podczas gdy Anna-Chiara omówiła, jak to może być dość onieśmielające, aby wskoczyć do projektu i otworzyć swoją pracę na krytykę. Wydaje się, że można wiele zrobić, aby społeczności open source były bardziej przyjazne dla wszystkich, w tym dla kobiet. Czekajcie na inicjatywę Toptal również tutaj!
Czy jesteś zaskoczony wynikami z GitHub? Jak myślisz, co one oznaczają?