L'open source è aperto alle donne?
Pubblicato: 2022-03-11Quanto segue è stato pubblicato prima del lancio di Toptal Scholarships for Female Developers. Per supportare i candidati alla borsa di studio, Toptal ha anche pubblicato una guida per dare il tuo primo contributo open source.
Le donne sono sottorappresentate nella tecnologia. Questa realizzazione non è una novità. Basta guardare i numeri rilasciati da Facebook, Google, Intel, Slack e molti, molti altri. Ma i numeri potrebbero essere anche peggiori di quanto implicano questi rapporti.
In un recente evento tecnologico, ho ascoltato una conversazione laterale sulla mancanza di diversità di genere nella tecnologia. Il piccolo gruppo stava discutendo del fatto che, anche se le donne costituiscono circa il 30% della forza lavoro nel settore tecnologico, i team di ingegneri di livello superiore raramente hanno più di poche donne.
Uno dei partecipanti a questa conversazione ha commentato che ciò era dovuto al fatto che gli sviluppatori maschi sono generalmente più talentuosi degli sviluppatori femmine. Nessuno nel gruppo si oppose.
Hmm…
Dall'esperienza personale alla Toptal e dalla mia esperienza universitaria in ingegneria a Princeton, che era quasi 50/50 maschi contro femmine, so che questo è falso. Ho lavorato con un numero di ingegneri donne incredibili e profondamente intelligenti in tutti i tipi di ruoli. Eppure i numeri non sembrano corrispondere alla mia esperienza, specialmente quando inizi a guardare a ruoli di ingegneria più senior.
E affrontare questa disparità è importante. Non è solo diversità per amore della diversità. Se uomini e donne sono ugualmente intelligenti, statisticamente parlando, delle dieci persone più intelligenti del mondo, cinque dovrebbero essere maschi e cinque dovrebbero essere femmine. Quindi, se la tua squadra è qualcosa di meno che un equilibrio uguale di uomini e donne, allora la tua squadra probabilmente non è la migliore possibile.
In un sistema perfetto, la diversità è un risultato probabilistico. Ma questi non sono i risultati che stiamo vedendo.
Dopo aver ascoltato questa conversazione, ho voluto dare un'occhiata ai numeri per capire meglio se/dove le tendenze di team building del software stavano andando male. Ho cercato su Google le tendenze nella ripartizione per genere tra i livelli di abilità nell'ingegneria del software, ma non sono riuscito a trovare molto, quindi ho deciso di guardare i dati pubblicamente disponibili su GitHub. Ho raschiato 5.000 profili per ottenere nomi, numero di follower, numero di contributi e numero di repository. Ho quindi utilizzato il pacchetto open source genderize.io per capire il sesso di ciascun profilo.
C'erano così poche donne in questo primo lotto che ho dovuto aggiungere più dati per rendere significativi anche i grafici semplici, quindi ne ho raschiati altri 15.000.
Ecco cosa ho trovato:
L'open source è dominato dagli uomini
Già prima di entrare in ulteriori analisi, era evidente che la percentuale di donne era estremamente bassa. Dei 20.000 profili, genderize.io è stato in grado di determinare con sicurezza il genere di 15.374. Di questi, solo il 6,0% (926) erano donne. La disparità diventa più grave una volta che inizi a dare un'occhiata all'attività degli utenti.
Prendiamo 10 contributi come limite per la differenza tra un utente che ha appena creato un profilo e magari ha sperimentato un po' e uno che ha almeno approfondito un progetto open source o ne ha iniziato uno proprio. Il risultato: 5,4% donne.
Infatti, se dividiamo gli utenti in bucket in base al loro numero di contributi (con un minimo di 1.000 utenti in ciascun bucket), la percentuale di utenze di sesso femminile tende a diminuire al crescere dei contributi.
Non solo ci sono molte meno donne su GitHub di quanto potrebbero suggerire i numeri sulla diversità di genere del settore tecnologico, ma sembra che la percentuale di donne diminuisca con l'aumento dell'attività degli utenti.
Ho continuato a scavare, guardando il genere in base al numero di follower e al numero di repository e ho osservato la stessa tendenza. Ciò era particolarmente chiaro quando si esaminava il numero di repository:
Ancora una volta, vediamo che la percentuale di femmine diminuisce man mano che ci spostiamo verso bucket con più repository.
Allora cosa sta succedendo qui? L'attività di GitHub è in primo luogo un indicatore ragionevole dell'esperienza di programmazione? (Penso che lo sia.) Le donne ingegneri di talento hanno meno probabilità di contribuire attivamente all'open source rispetto alle loro controparti maschili? Questi risultati sono un altro indicatore dei problemi di ingresso/ritenzione dell'industria tecnologica quando si tratta di ingegneri donne?
Perché i numeri nella comunità open source sono così bassi?
I numeri per le donne nel settore tecnologico sono già piuttosto deprimenti, ma sono anche peggiori nei progetti open source.
Molte ricerche precedenti si sono concentrate sui motivi per cui le donne non sono disposte a intraprendere materie e carriere legate alle STEM. Alcuni concludono una generale mancanza di interesse per le materie STEM. Altri credono che le donne decidano di non intraprendere carriere STEM dopo essere state stereotipate dalla famiglia e dagli insegnanti. Altri ancora citano la mancanza di modelli di comportamento o una combinazione di molteplici cause.
Secondo uno studio sul genere in StackOverflow, “La questione del genere e delle materie relative alle STEM è stata studiata per diversi anni e principalmente dal punto di vista del 'perché' le donne non intraprendono studi scientifici o carriere. Minore attenzione è stata finora riservata alla quantificazione del fenomeno e della rappresentazione delle donne nelle comunità online (in quanto "utenti" di tecnologia), quali sono i loro livelli di partecipazione e se possono essere rilevate differenze a livello di genere. Sono state raccolte solo prove aneddotiche su come comunità specifiche scoraggiano attivamente le donne dal partecipare”.
Ma quando passiamo così tanto tempo a concentrarci sul perché ci sono meno donne che si occupano di materie STEM, perdiamo la concentrazione su un'altra importante disparità: se il 28% dei master CS va alle donne, perché i numeri nella comunità open source sono così tanti inferiore?
Ci sono alcune possibilità da considerare quando si pensa a una risposta a questa domanda:
1. Forse non c'è una forte correlazione tra il talento di programmazione e l'attività di GitHub.
Nel settore tecnologico, molti sviluppatori si rivolgono a GitHub all'inizio della loro carriera poiché è un prerequisito per essere presi sul serio. Tuttavia, sembra che meno aspiranti sviluppatori donne vedano l'open source in questo modo. È possibile che questi dati siano tutti casuali e non significhino molto in relazione al numero di talentuose ingegneri del software nel settore tecnologico?
Ho discusso la questione con due ingegneri della Toptal, Anna-Chiara Bellini e Bozhidar Batsov. Anna-Chiara ha oltre 20 anni di esperienza nell'ingegneria del software in una varietà di contesti accademici e aziendali e Bozhidar è il numero 98 nell'elenco dei contributori GitHub più attivi al mondo.
Entrambi hanno convenuto che mentre essere attivi su GitHub è in genere un buon indicatore di competenza ingegneristica, non è vero il contrario, menzionando che conoscono molti grandi ingegneri che non sono affatto coinvolti nell'open source. Anche l'industria tecnologica è d'accordo, con molte aziende che valutano i profili GitHub durante i processi di assunzione (sebbene questa pratica sembri essere piuttosto parziale, il che non è davvero una sorpresa visti i risultati del mio studio).
Bozhidar ha suggerito che i contributori open source hanno spesso maggiori probabilità di essere il tipo di persone che spingono per grandi cambiamenti interni in un ambiente aziendale. Anna-Chiara ha commentato che ci vuole molta fiducia per contribuire all'open source, qualcosa che secondo lei potrebbe essere più difficile da superare per le sviluppatori donne, data la scarsa storia dell'industria tecnologica con l'accoglienza delle donne.
Ci sono sicuramente diversi pregiudizi che potrebbero potenzialmente essere in gioco con questi dati GitHub (incluso il fatto che quasi il 25% dei nomi non può essere classificato come maschio/femmina con sicurezza).
Tuttavia, Bozhidar, Anna-Chiara e io siamo d'accordo sul fatto che il livello di attività di GitHub è generalmente un buon indicatore dell'esperienza di programmazione. Eppure questi dati suggeriscono una tendenza di programmatrici di talento che scelgono di interrompere (o non iniziare mai) le loro attività open source a favore di altre opzioni.
2. I numeri citati nei rapporti delle società tecnologiche includono ruoli non tecnologici.
Molte aziende del settore tecnologico affermano di impiegare tra il 25 e il 30% di donne. Questo numero, tuttavia, può essere fuorviante. La maggior parte di questi numeri più grandi - sì, sono quelli più grandi - includono ruoli sia tecnici che non tecnici.
Quando si inizia a esaminare la percentuale di dipendenti di sesso femminile in ruoli tecnici, i numeri scendono ancora più in basso.

In Facebook, il 32% dei dipendenti sono donne, ma solo il 16% dei ruoli tecnici appartiene a donne. In Google, c'è un calo simile del 30% delle dipendenti di sesso femminile nell'azienda nel suo insieme al 18% in ruoli tecnici. Slack scende dal 39% delle donne in generale al 18% nei ruoli di ingegneria. Tra le aziende che ho esaminato, Intel ha il salto più piccolo, passando dal 24,1% di donne in generale al 19,4% in ruoli tecnici.
Quindi, anche se molte aziende vantano una percentuale di dipendenti di sesso femminile che è di circa un quarto o addirittura un terzo dell'azienda, il numero di donne in ruoli tecnici è in realtà molto più basso. Sembra che affermazioni dal 15 al 20 percento sarebbero più accurate.
Ma ciò lascia ancora un'enorme disparità tra la percentuale di donne coinvolte in ruoli tecnici o ingegneristici presso aziende tecnologiche e la percentuale di donne che contribuiscono a progetti open source su GitHub.
3. Le programmatrici donne stanno lasciando l'industria tecnologica.
Se l'attività su GitHub è correlata all'anzianità e all'esperienza, il numero estremamente basso di contributori donne attive (basso anche rispetto ai contributori donne in generale) potrebbe essere spiegato dal tasso allarmante di allontanamento delle donne ingegneri dall'industria tecnologica.
Se l'industria tecnologica non riesce a trattenere tante donne oltre il livello di metà carriera, è probabile che non contribuiranno nemmeno a molti progetti open source.
Ma questa linea di ragionamento pone anche la domanda: la correlazione tra anzianità e contribuzione è effettivamente vera? Molti collaboratori frequenti di OSS sono programmatori relativamente nuovi che stanno cercando di farsi un nome - quindi dove sono le donne di quel gruppo?
4. GitHub può essere una comunità inospitale per le programmatrici.
Commentando un articolo sulle donne nella tecnologia, una sviluppatrice dice: “Per quanto riguarda i progetti open source, ci ho pensato di recente. In realtà non mi sono impegnato con nessuno e questo mette sicuramente un nodo nella mia carriera... mi sento come se fosse un cerchio in cui non posso entrare. Ma soprattutto temo i riflettori eccessivi di essere un'unica programmatrice donna su un progetto pubblicamente disponibile. Alla luce di come vengono trattate le donne su Internet, questa paura non sembra irragionevole”.
Anna-Chiara crede che questo tipo di apprensione sia un tema comune tra le donne ingegneri, specialmente quando si tratta di OSS. Quando le ho chiesto se pensava che le donne fossero meno propense a contribuire ai progetti open source, ha risposto, senza esitazione, di sì.
Anna-Chiara ha anche sollevato la possibilità che gli utenti di GitHub di sesso femminile possano provare ad adottare un nome maschile o neutro per assicurarsi di essere presi sul serio (ricorda che genderize.io non è stato in grado di determinare con sicurezza il sesso di circa un quarto degli profili raschiati).
Ciò non significa, tuttavia, che le collaboratrici non siano là fuori. Bozidhar fa apparire Exercism.io, un popolare progetto avviato da Katrina Owen che ha diverse collaboratrici. Cita anche Bodil Stokke, una sviluppatrice norvegese con una storia estremamente ampia di contributi open source popolari.
Anna-Chiara suggerisce anche che se un progetto avesse donne tra i principali contributori o leader, è più probabile che le sviluppatori donne vi contribuiscano. Sfortunatamente, rispetto al numero di progetti dominati dagli uomini là fuori, i progetti OSS guidati da donne sono difficili da trovare.
Ma il problema è più ampio del semplice OSS. “Se penso alle donne che conosco in fase di sviluppo, non è neanche lontanamente vicino al 20% di cui si sente parlare in queste grandi aziende. Non credo che sia nemmeno vicino al 10%”, mi dice Anna-Chiara. "Il risultato di questa analisi di GitHub non mi sorprende."
5. I pregiudizi impliciti che modellano l'industria tecnologica potrebbero penetrare in GitHub.
Eric Ries sottolinea i problemi di pregiudizi impliciti nell'industria tecnologica. Anche se le singole persone all'interno dei sistemi non sono di parte, è comunque estremamente facile che tali sistemi diventino di parte. Le persone hanno anche pregiudizi inconsci, il che complica ulteriormente la questione.
Nel suo articolo, Eric usa l'esempio delle orchestre, che erano principalmente tutte maschili fino agli anni '70. La gente credeva che gli artisti maschi avessero un'attitudine per la musica superiore rispetto alle interpreti donne. Tuttavia, una volta che le orchestre hanno iniziato a separare i musicisti dai giudici con uno schermo fisico durante le audizioni, i numeri sono cambiati in modo significativo e le persone hanno iniziato ad accettare che uomini e donne suonassero in media ugualmente bene.
Se pregiudizi simili entrano in gioco con l'assunzione di sistemi nel settore tecnologico, potrebbe aiutare a spiegare la percentuale più piccola di ingegneri del software donne di cui ho discusso in precedenza. E se vengono assunte meno ingegneri del software donne, quegli effetti potrebbero infiltrarsi nelle comunità open source come GitHub. Se qualcuno viene rifiutato per ruoli di programmazione a tempo pieno, potrebbe arrivare a credere di non avere altrettanto talento e quindi sarebbe meno probabile che abbia la fiducia necessaria per contribuire a progetti open source.
Dove ci lascia questo?
Ecco alcune domande di follow-up che mi vengono in mente (e ce ne sono molte altre):
1. Come cambiano questi numeri nel tempo?
Coinvolgere più donne nell'industria tecnologica è un argomento molto discusso in questo momento e l'aumento dei bootcamp di codifica che richiedono contributi dovrebbe avere un impatto positivo, anche quando si tratta di open source. Quanto sono efficaci queste discussioni e le varie nuove iniziative? Come sarebbero questi numeri 3 anni fa? 5 anni fa? E tra un anno?
2. In quale altro modo possiamo analizzare i dati GitHub?
Anna-Chiara ha suggerito di esaminare la ripartizione per genere degli utenti in base al numero di fork di cui dispongono per avere un'idea della frequenza con cui le donne GitHub sperimentano un progetto in qualche modo. Inoltre, ci sono altri fattori in gioco, come il gruppo di età, che potrebbero influenzare i nostri risultati. L'open source è stato per molto tempo un punto fermo dell'industria tecnologica, ma GitHub è stata fondata solo nel 2008.
3. C'è un buon modo per vedere quali utenti GitHub utilizzano un nome falso?
Se la percentuale di donne che usano un nome falso è molto più alta della percentuale di donne su GitHub in generale, ciò renderebbe un'affermazione molto forte su quanto sia accogliente GitHub (e la tecnologia in generale, in una certa misura) come comunità.
4. Come cambiano questi numeri quando inizi a guardare la posizione?
Questo è imperfetto, poiché l'interazione su GitHub è teoricamente indipendente dalla posizione. Ma possiamo imparare qualcosa dalle comunità tecnologiche nei paesi in cui una percentuale di utenti GitHub di sesso femminile è superiore alla media.
Ed ecco alcune idee per migliorare questi numeri (di nuovo, ce ne sono ovviamente molti di più):
1. È possibile migliorare le pagine dei popolari repository GitHub?
Quando ho discusso questo argomento con Bozhidar, ha menzionato che la maggior parte dei progetti/community su GitHub hanno leader estremamente pazienti, accoglienti e felici di guidare i nuovi contributori open source nelle prime fasi del progetto. Questo non sembra essere affatto una conoscenza comune (ricorda il commento di cui sopra di una sviluppatrice che riteneva che le comunità open source fossero "un circolo [in cui non poteva] entrare").
I nuovi utenti di GitHub sono consapevoli dell'esistenza di questo tipo di tutoraggio e supporto (supponendo che sia così diffuso come dice) e un nuovo utente saprebbe come trovare facilmente tale guida? Potrebbero essere apportati miglioramenti alle interfacce dei popolari repository GitHub per renderlo più ovvio e renderli più accoglienti? Ad esempio, se le pagine di repository popolari includessero qualcosa come un ruolo ufficiale di "Mentore di repository", forse sarebbe molto più chiaro che un utente accogliente ed esperto fosse disponibile a rispondere a qualsiasi domanda.
2. Pubblica migliori (e più diffuse) guide "Guida introduttiva a GitHub".
Ci sono molti post là fuori che ti insegnano come usare GitHub guidandoti attraverso pull/push, commit, branching e altro, ma non trovo quasi nulla in termini di linee guida per interagire all'interno della community GitHub (se ne conosci qualsiasi, si prega di pubblicare i collegamenti pertinenti nei commenti).
Una guida pratica per navigare nell'etichetta della community di GitHub e le migliori pratiche in base al tuo livello di abilità potrebbe aiutare a scomporre gli elementi di intimidazione e mettere in luce il contributo all'open source. Questo è sicuramente qualcosa che potrebbe incoraggiare nuovi sviluppatori più aspiranti a essere coinvolti. Resta sintonizzato per una guida come questa di Toptal.
3. Più tutoraggio potrebbe fare un'enorme differenza.
Bozhidar ha commentato l'importanza degli sviluppatori coinvolti nel progetto che erano disposti ad aiutare i nuovi arrivati a iniziare con le attività di base, mentre Anna-Chiara ha discusso di come potrebbe essere piuttosto intimidatorio entrare in un progetto e aprire il tuo lavoro alle critiche. Sembra che si possa fare molto per rendere le comunità open source più accoglienti per tutti, comprese le donne. Resta sintonizzato per un'iniziativa di Toptal anche qui!
Sei sorpreso dai risultati di GitHub? Cosa pensi che intendano?