Ist Open Source offen für Frauen?

Veröffentlicht: 2022-03-11

Das Folgende wurde vor dem Start von Toptal-Stipendien für weibliche Entwickler veröffentlicht. Um Stipendienbewerber zu unterstützen, hat Toptal auch einen Leitfaden für Ihren ersten Open-Source-Beitrag veröffentlicht.

Frauen sind in der Technik unterrepräsentiert. Diese Erkenntnis ist nichts Neues. Schauen Sie sich nur die Zahlen an, die von Facebook, Google, Intel, Slack und vielen, vielen mehr veröffentlicht wurden. Aber die Zahlen könnten noch schlimmer sein, als diese Berichte andeuten.

Bei einer kürzlichen Tech-Veranstaltung habe ich zufällig ein Nebengespräch über den Mangel an Geschlechterdiversität in der Technik mitgehört. Die kleine Gruppe diskutierte die Tatsache, dass, obwohl Frauen etwa 30 % der Belegschaft in der Technik ausmachen, höhere Ingenieurteams selten mehr als ein paar Frauen haben.

Einer der Teilnehmer an diesem Gespräch kommentierte, dass dies daran liege, dass männliche Entwickler im Allgemeinen einfach talentierter sind als weibliche Entwickler. Niemand in der Gruppe widersprach.

Hmm…

Aus persönlicher Erfahrung bei Toptal und meiner Universitätserfahrung im Ingenieurwesen in Princeton, die fast 50/50 männlich vs. weiblich war, weiß ich, dass dies falsch ist. Ich habe mit einer Reihe unglaublicher, zutiefst intelligenter Ingenieurinnen in allen möglichen Rollen zusammengearbeitet. Die Zahlen scheinen jedoch nicht mit meiner eigenen Erfahrung übereinzustimmen, insbesondere wenn man sich die höheren Positionen im Ingenieurwesen ansieht.

Und es ist wichtig, diese Diskrepanz anzugehen. Es ist nicht nur Vielfalt um der Vielfalt willen. Wenn Männer und Frauen statistisch gesehen gleich intelligent sind, dann sollten von den zehn klügsten Menschen der Welt fünf männlich und fünf weiblich sein. Wenn also Ihr Team weniger als ein ausgewogenes Verhältnis von Männern und Frauen ist, dann ist Ihr Team wahrscheinlich nicht das Beste, was es sein kann.

Wenn Ihr Team weniger als ein ausgewogenes Verhältnis von Männern und Frauen ist, dann ist Ihr Team wahrscheinlich nicht das Beste, was es sein kann.

In einem perfekten System ist Diversität ein probabilistisches Ergebnis. Aber das sind nicht die Ergebnisse, die wir sehen.

Nachdem ich dieses Gespräch belauscht hatte, wollte ich einen Blick auf die Zahlen werfen, um besser zu verstehen, ob/wo die Tendenzen beim Software-Teambuilding schief gehen. Ich habe bei Google nach Trends in der geschlechtsspezifischen Aufschlüsselung nach Qualifikationsniveaus in der Softwareentwicklung gesucht, aber ich konnte nicht viel finden, also habe ich mich entschieden, mir die öffentlich verfügbaren Daten auf GitHub anzusehen. Ich habe 5.000 Profile durchsucht, um Namen, Anzahl der Follower, Anzahl der Beiträge und Anzahl der Repositories zu erhalten. Ich habe dann das Open-Source-Paket genderize.io verwendet, um das Geschlecht jedes Profils herauszufinden.

Es gab so wenige Frauen in dieser ersten Charge, dass ich mehr Daten hinzufügen musste, um selbst einfache Diagramme aussagekräftig zu machen, also habe ich 15.000 mehr abgekratzt.

Hier ist, was ich gefunden habe:

Wie offen ist Open Source für Frauen?

Ist Open Source offen für Frauen?
Twittern

Open Source wird von Männern dominiert

Schon vor der weiteren Analyse wurde deutlich, dass der Frauenanteil extrem gering war. Von den 20.000 Profilen konnte genderize.io bei 15.374 das Geschlecht sicher bestimmen. Davon waren nur 6,0 % (926) Frauen. Die Diskrepanz wird noch größer, wenn Sie anfangen, sich die Benutzeraktivität anzusehen.

Nehmen wir 10 Beiträge als Grenze für den Unterschied zwischen einem Nutzer, der gerade ein Profil erstellt und vielleicht ein bisschen herumexperimentiert hat, und einem, der sich zumindest in ein Open-Source-Projekt vertieft oder ein eigenes gestartet hat. Das Ergebnis: 5,4 % Frauen.

Nur 5,4 % der GitHub-Nutzer mit über 10 Beiträgen aus unserer Stichprobe sind weiblich.
Twittern

In der Tat, wenn wir Benutzer entsprechend ihrer Anzahl von Beiträgen in Gruppen aufteilen (mit einem Minimum von 1.000 Benutzern in jeder Gruppe), neigt der Prozentsatz der weiblichen Benutzer dazu, mit steigenden Beiträgen abzunehmen.

Es gibt nicht nur weit weniger Frauen auf GitHub, als die Zahlen zur Geschlechtervielfalt in der Technologiebranche vermuten lassen, sondern es sieht so aus, als würde der Prozentsatz der Frauen mit zunehmender Benutzeraktivität abnehmen.

Ich habe weiter gegraben, das Geschlecht über die Anzahl der Follower und die Anzahl der Repositories hinweg betrachtet und den gleichen Trend beobachtet. Dies wurde besonders deutlich, wenn man sich die Anzahl der Repositories anschaut:

Auch hier sehen wir, dass der Prozentsatz der Weibchen abnimmt, wenn wir zu Buckets mit mehr Repositories wechseln.

Also, was ist hier los? Ist die GitHub-Aktivität überhaupt ein vernünftiger Indikator für Programmierkompetenz? (Ich denke schon.) Tragen talentierte Ingenieurinnen weniger aktiv zu Open Source bei als ihre männlichen Kollegen? Sind diese Ergebnisse ein weiterer Indikator für die Einstiegs-/Bindungsprobleme der Tech-Industrie, wenn es um weibliche Ingenieure geht?

Warum sind die Zahlen in der Open-Source-Community so niedrig?

Die Zahlen für Frauen in der Technologiebranche sind bereits ziemlich düster, aber bei Open-Source-Projekten sind sie noch schlimmer.

Ein Großteil der bisherigen Forschung konzentrierte sich auf die Gründe, warum Frauen nicht bereit sind, sich in MINT-bezogenen Fächern und Karrieren einzuschreiben. Manche schlussfolgern auf ein generelles Desinteresse an MINT-Fächern. Andere glauben, dass Frauen sich gegen eine MINT-Karriere entscheiden, nachdem sie von Familie und Lehrern stereotypisiert wurden. Wieder andere nennen einen Mangel an Vorbildern oder eine Kombination mehrerer Ursachen.

Laut einer Studie zum Thema Geschlecht in StackOverflow „wird das Thema Geschlecht und MINT-bezogene Fächer seit mehreren Jahren untersucht, und zwar hauptsächlich unter dem Gesichtspunkt, ‚warum‘ Frauen sich nicht für wissenschaftliche Studien oder Karrieren engagieren. Weniger Aufmerksamkeit wurde bisher der Quantifizierung des Phänomens und der Repräsentation von Frauen in Online-Communities (als Technologie-„Nutzerinnen“) gewidmet, wie hoch ihre Teilnahme ist und ob Unterschiede auf Geschlechterebene festgestellt werden können. Es wurden nur anekdotische Beweise dafür gesammelt, wie bestimmte Gemeinschaften Frauen aktiv von der Teilnahme abhalten.“

Aber wenn wir so viel Zeit damit verbringen, uns darauf zu konzentrieren, warum es weniger Frauen gibt, die sich mit MINT-bezogenen Fächern befassen, verlieren wir den Fokus auf eine andere wichtige Ungleichheit: Wenn 28 % der CS-Masterabschlüsse an Frauen gehen, warum sind die Zahlen in der Open-Source-Community so hoch? niedriger?

Bei der Beantwortung dieser Frage gibt es einige Möglichkeiten zu berücksichtigen:

1. Vielleicht gibt es keine starke Korrelation zwischen Programmiertalent und GitHub-Aktivität.

In der Technologiebranche gehen viele Entwickler früh in ihrer Karriere zu GitHub, da dies eine Voraussetzung ist, um ernst genommen zu werden. Es scheint jedoch, dass weniger aufstrebende Entwicklerinnen Open Source so sehen. Ist es möglich, dass diese Daten rein zufällig sind und im Verhältnis zur Anzahl talentierter weiblicher Software-Ingenieure in der Tech-Branche nicht viel aussagen?

Ich habe die Frage mit zwei Ingenieuren bei Toptal, Anna-Chiara Bellini und Bozhidar Batsov, besprochen. Anna-Chiara verfügt über mehr als 20 Jahre Erfahrung in der Softwareentwicklung in einer Vielzahl von akademischen und geschäftlichen Umgebungen, und Bozhidar ist die Nummer 98 auf der Liste der aktivsten GitHub-Mitwirkenden der Welt.

Beide waren sich einig, dass die Aktivität auf GitHub normalerweise ein guter Indikator für Engineering-Expertise ist, das Gegenteil jedoch nicht der Fall ist, und erwähnten, dass sie viele großartige Ingenieure kennen, die überhaupt nicht mit Open Source zu tun haben. Auch die Tech-Branche stimmt zu, da viele Unternehmen GitHub-Profile während der Einstellungsverfahren bewerten (obwohl diese Praxis ziemlich voreingenommen zu sein scheint, was angesichts der Ergebnisse meiner Studie nicht wirklich überrascht).

GitHub-Aktivität ist im Allgemeinen ein guter Indikator für Engineering-Expertise, aber das Gegenteil ist nicht der Fall … Viele großartige Ingenieure sind nicht auf GitHub.
Twittern

Bozhidar schlug vor, dass Open-Source-Mitwirkende oft eher zu den Menschen gehören, die auf große interne Veränderungen in einem Unternehmen drängen. Anna-Chiara kommentierte, dass es sehr viel Selbstvertrauen brauche, um zu Open Source beizutragen, etwas, das ihrer Meinung nach für weibliche Entwickler schwieriger zu überwinden sei, angesichts der schlechten Geschichte der Technologiebranche, Frauen willkommen zu heißen.

Es gibt sicherlich mehrere Vorurteile, die bei diesen GitHub-Daten eine Rolle spielen könnten (einschließlich der Tatsache, dass fast 25 % der Namen nicht sicher als männlich/weiblich klassifiziert werden konnten).

Bozhidar, Anna-Chiara und ich waren uns jedoch einig, dass das Aktivitätsniveau von GitHub im Allgemeinen ein guter Indikator für Programmierkenntnisse ist. Diese Daten deuten jedoch auf einen Trend talentierter Programmiererinnen hin, die sich dafür entscheiden, ihre Open-Source-Aktivitäten zugunsten anderer Optionen einzustellen (oder nie zu beginnen).

2. Zahlen, die in Berichten von Technologieunternehmen genannt werden, beinhalten nicht-technische Positionen.

Viele Unternehmen in der Technologiebranche geben an, dass sie zwischen 25 und 30 Prozent Frauen beschäftigen. Diese Zahl kann jedoch irreführend sein. Die meisten dieser größeren Zahlen – ja, sie sind die größeren – beinhalten sowohl technische als auch nicht-technische Rollen.

Wenn Sie beginnen, den Anteil weiblicher Mitarbeiter in technischen Positionen zu untersuchen, sinken die Zahlen noch weiter.

Bei Facebook sind 32 Prozent der Mitarbeiter weiblich, aber nur 16 Prozent der technischen Rollen gehören Frauen. Bei Google gibt es einen ähnlichen Rückgang von 30 Prozent weiblicher Mitarbeiter im gesamten Unternehmen auf 18 Prozent in technischen Rollen. Slack sinkt von 39 Prozent Frauen insgesamt auf 18 Prozent in technischen Positionen. Von den Unternehmen, die ich untersucht habe, hat Intel den kleinsten Sprung, von 24,1 Prozent Frauen insgesamt auf 19,4 Prozent in technischen Positionen.

Obwohl viele Unternehmen einen Anteil weiblicher Mitarbeiter von etwa einem Viertel oder sogar einem Drittel des Unternehmens aufweisen, ist die Anzahl der Frauen in technischen Funktionen tatsächlich viel geringer. Es scheint, dass Behauptungen von 15 bis 20 Prozent zutreffender wären.

Aber das lässt immer noch eine große Diskrepanz zwischen dem Prozentsatz der Frauen, die in technischen oder technischen Positionen in Technologieunternehmen involviert sind, und dem Prozentsatz der Frauen, die zu Open-Source-Projekten auf GitHub beitragen.

3. Programmiererinnen verlassen die Tech-Branche.

Wenn die Aktivität auf GitHub mit Dienstalter und Fachwissen korreliert, dann könnte die extrem niedrige Zahl aktiver weiblicher Mitwirkender (selbst im Vergleich zu den weiblichen Mitwirkenden insgesamt niedrig) durch die alarmierend hohe Abgangsrate von weiblichen Ingenieuren aus der Technologiebranche erklärt werden.

Von den Frauen, die in die Technologiebranche eintreten, verlassen 56 Prozent sie bis zur Mitte ihrer Karriere, was doppelt so hoch ist wie die Fluktuationsrate bei Männern.
Twittern

Wenn die Tech-Branche nicht so viele Frauen über die Mitte ihrer Karriere hinaus halten kann, werden sie wahrscheinlich auch nicht zu vielen Open-Source-Projekten beitragen.

Aber diese Argumentation wirft auch die Frage auf: Stimmt der Zusammenhang zwischen Dienstalter und Beitrag tatsächlich? Viele häufige OSS-Beitragende sind relativ neue Programmierer, die versuchen, sich einen Namen zu machen – wo sind also die Frauen aus dieser Gruppe?

4. GitHub kann eine unfreundliche Community für Programmiererinnen sein.

In einem Kommentar zu einem Artikel über Frauen in der Technik sagt eine Entwicklerin: „In Bezug auf die Open-Source-Projekte – darüber habe ich kürzlich nachgedacht. Ich habe mich eigentlich zu keinem verpflichtet und es bringt definitiv einen Knick in meine Karriere … Ich habe das Gefühl, dass es ein Kreis ist, in den ich nicht hineinkommen kann. Aber am meisten fürchte ich das übermäßige Rampenlicht, eine einzige weibliche Programmiererin bei einem öffentlich zugänglichen Projekt zu sein. Angesichts der Art und Weise, wie Frauen im Internet behandelt werden, erscheint diese Angst nicht unbegründet.“

Anna-Chiara glaubt, dass diese Art von Befürchtungen ein häufiges Thema unter weiblichen Ingenieuren ist, insbesondere wenn es um OSS geht. Als ich sie fragte, ob sie der Meinung sei, dass Frauen weniger wahrscheinlich zu Open-Source-Projekten beitragen würden, antwortete sie ohne zu zögern, ja.

Anna-Chiara sprach auch die Möglichkeit an, dass weibliche GitHub-Benutzer versuchen könnten, einen geschlechtsneutralen oder männlichen Namen anzunehmen, um sicherzustellen, dass sie ernst genommen werden (denken Sie daran, dass genderize.io nicht in der Lage war, das Geschlecht von etwa einem Viertel der Profile geschabt).

Das bedeutet jedoch nicht, dass es keine weiblichen Mitwirkenden gibt. Bozidhar bringt Exercism.io zur Sprache, ein beliebtes Projekt, das von Katrina Owen gestartet wurde und an dem mehrere weibliche Mitwirkende arbeiten. Er erwähnt auch Bodil Stokke, eine Entwicklerin aus Norwegen mit einer äußerst umfangreichen Geschichte beliebter Open-Source-Beiträge.

Anna-Chiara schlägt auch vor, dass, wenn ein Projekt Frauen unter den Top-Beitragenden oder -Führungskräften hat, weibliche Entwickler eher dazu beitragen könnten. Leider sind von Frauen geführte OSS-Projekte im Vergleich zu der Anzahl der von Männern dominierten Projekte da draußen schwer zu finden.

Aber das Problem ist größer als nur OSS. „Wenn ich an die Frauen denke, die ich in der Entwicklung kenne, sind es bei weitem nicht die 20 %, von denen man in diesen großen Unternehmen hört. Ich glaube nicht, dass es auch nur annähernd 10 % sind“, sagt mir Anna-Chiara. „Das Ergebnis dieser Analyse von GitHub überrascht mich nicht.“

5. Implizite Vorurteile, die die Technologiebranche prägen, könnten in GitHub einsickern.

Eric Ries weist auf Probleme impliziter Vorurteile in der Technologiebranche hin. Selbst wenn einzelne Personen innerhalb von Systemen nicht voreingenommen sind, können diese Systeme dennoch sehr leicht voreingenommen werden. Menschen haben auch unbewusste Vorurteile, was das Thema noch komplizierter macht.

Eric verwendet in seinem Artikel das Beispiel von Orchestern, die bis in die 1970er Jahre hauptsächlich rein männlich waren. Die Leute glaubten, dass männliche Darsteller eine bessere Begabung für Musik hätten als weibliche Darsteller. Als Orchester jedoch anfingen, Musiker von Richtern mit einem physischen Bildschirm während des Vorsprechens zu trennen, verschob sich die Zahl erheblich, und die Menschen begannen zu akzeptieren, dass Männer und Frauen im Durchschnitt gleich gut spielten.

Wenn ähnliche Vorurteile bei Einstellungssystemen in der Technologiebranche ins Spiel kommen, könnte dies dazu beitragen, den geringeren Prozentsatz weiblicher Softwareentwickler zu erklären, den ich zuvor besprochen habe. Und wenn weniger weibliche Softwareentwickler eingestellt werden, könnten diese Auswirkungen in Open-Source-Communities wie GitHub einsickern. Wenn jemand für eine Vollzeitstelle als Programmierer abgelehnt wird, könnte er glauben, dass er nicht so talentiert ist und daher weniger das Selbstvertrauen hat, zu Open-Source-Projekten beizutragen.

Wo bleibt uns das?

Hier sind einige Folgefragen, die mir in den Sinn kommen (und es gibt noch viel mehr):

1. Wie verändern sich diese Zahlen im Laufe der Zeit?

Mehr Frauen in die Technologiebranche einzubeziehen, ist derzeit ein viel diskutiertes Thema, und die Zunahme von Programmier-Bootcamps, die Beiträge erfordern, sollte sich positiv auswirken, auch wenn es um Open Source geht. Wie effektiv sind diese Diskussionen und die verschiedenen neuen Initiativen? Wie würden diese Zahlen vor 3 Jahren aussehen? vor 5 Jahren? Was ist in einem Jahr?

2. Wie können wir GitHub-Daten sonst noch analysieren?

Anna-Chiara schlug vor, die Geschlechterverteilung der Benutzer anhand der Anzahl der Forks zu untersuchen, die sie haben, um eine Vorstellung davon zu bekommen, wie häufig weibliche GitHub-Benutzer auf irgendeine Weise mit einem Projekt experimentieren. Darüber hinaus spielen andere Faktoren wie die Altersgruppe eine Rolle, die unsere Ergebnisse beeinflussen könnten. Open Source ist seit langem ein fester Bestandteil der Technologiebranche, aber GitHub wurde erst 2008 gegründet.

3. Gibt es eine gute Möglichkeit zu sehen, welche GitHub-Benutzer einen falschen Namen verwenden?

Wenn der Prozentsatz der Frauen, die einen falschen Namen verwenden, viel höher ist als der Prozentsatz der Frauen auf GitHub insgesamt, würde dies eine sehr starke Aussage darüber machen, wie einladend GitHub (und Tech im Allgemeinen bis zu einem gewissen Grad) als Community ist.

4. Wie ändern sich diese Zahlen, wenn Sie anfangen, sich den Standort anzusehen?

Dies ist unvollkommen, da die Interaktion auf GitHub theoretisch ortsunabhängig ist. Aber können wir etwas von den Tech-Communities in Ländern lernen, die einen überdurchschnittlich hohen Anteil weiblicher GitHub-Nutzer haben?

Und hier sind einige Ideen zur Verbesserung dieser Zahlen (auch hier gibt es natürlich noch viel mehr):

1. Können die Seiten beliebter GitHub-Repositories verbessert werden?

Als ich dieses Thema mit Bozhidar diskutierte, erwähnte er, dass die meisten Projekte/Communities auf GitHub Leiter haben, die äußerst geduldig, einladend und glücklich sind, neue Open-Source-Mitwirkende durch die frühen Phasen des Projekts zu führen. Dies scheint überhaupt nicht allgemein bekannt zu sein (erinnern Sie sich an den oben erwähnten Kommentar einer Entwicklerin, die das Gefühl hatte, dass Open-Source-Communities „ein Kreis waren, in den sie nicht hineinkommen konnte“).

Sind sich neue GitHub-Benutzer bewusst, dass diese Art von Mentoring und Unterstützung existiert (vorausgesetzt, dass sie so weit verbreitet ist, wie er sagt), und würde ein neuer Benutzer wissen, wie er eine solche Anleitung leicht finden kann? Könnten Verbesserungen an den Schnittstellen beliebter GitHub-Repositories vorgenommen werden, um dies offensichtlicher und einladender zu machen? Wenn zum Beispiel populäre Repository-Seiten so etwas wie eine offizielle „Repository Mentor“-Rolle enthalten würden, wäre es vielleicht viel klarer, dass ein einladender, erfahrener Benutzer zur Verfügung steht, um alle Fragen zu beantworten.

2. Veröffentlichen Sie bessere (und verbreitetere) „Erste Schritte mit GitHub“-Leitfäden.

Es gibt viele Beiträge da draußen, die Ihnen beibringen, wie man GitHub verwendet, indem sie Sie durch Pulls/Pushes, Commits, Verzweigungen und mehr führen, aber ich finde so gut wie nichts in Bezug auf Richtlinien für die Interaktion innerhalb der GitHub-Community (falls Sie davon wissen). Bitte posten Sie relevante Links in den Kommentaren).

Eine Anleitung zum Navigieren in der GitHub-Community-Etikette und Best Practices entsprechend Ihrem Kenntnisstand kann dazu beitragen, die Einschüchterung abzubauen und die Elemente des Beitrags zu Open Source ins Rampenlicht zu rücken. Dies ist definitiv etwas, das mehr aufstrebende neue Entwickler ermutigen könnte, sich zu engagieren. Seien Sie gespannt auf einen solchen Guide von Toptal.

3. Mehr Mentoring könnte einen enormen Unterschied machen.

Bozhidar kommentierte die Bedeutung der am Projekt beteiligten Entwickler, die bereit seien, Neulingen beim Einstieg in grundlegende Aufgaben zu helfen, während Anna-Chiara darüber sprach, wie es ziemlich einschüchternd sein könne, sich in ein Projekt zu stürzen und seine Arbeit der Kritik auszusetzen. Es scheint, dass viel getan werden könnte, um Open-Source-Communities für alle, einschließlich Frauen, einladender zu gestalten. Seien Sie auch hier gespannt auf eine Initiative von Toptal!

Sind Sie von den Ergebnissen von GitHub überrascht? Was denkst du, was sie meinen?