L'open source est-il ouvert aux femmes ?

Publié: 2022-03-11

Ce qui suit a été publié avant le lancement des bourses Toptal pour les femmes développeurs. Pour soutenir les candidats aux bourses, Toptal a également publié un guide pour faire votre première contribution open source.

Les femmes sont sous-représentées dans la technologie. Cette prise de conscience n'a rien de nouveau. Il suffit de regarder les chiffres publiés par Facebook, Google, Intel, Slack et bien d'autres. Mais les chiffres pourraient être encore pires que ne le suggèrent ces rapports.

Lors d'un récent événement technologique, j'ai entendu une conversation parallèle sur le manque de diversité des sexes dans la technologie. Le petit groupe discutait du fait que même si les femmes représentent environ 30 % de la main-d'œuvre dans la technologie, les équipes d'ingénierie de niveau supérieur comptent rarement plus de quelques femmes.

L'un des participants à cette conversation a déclaré que c'était parce que les développeurs masculins étaient généralement plus talentueux que les développeurs féminins. Personne dans le groupe ne s'y est opposé.

Hmm…

D'après mon expérience personnelle chez Toptal et mon expérience universitaire en ingénierie à Princeton, qui était presque 50/50 hommes contre femmes, je sais que c'est faux. J'ai travaillé avec un certain nombre d'ingénieures incroyables et profondément intelligentes dans toutes sortes de rôles. Pourtant, les chiffres ne semblent pas correspondre à ma propre expérience, en particulier lorsque vous commencez à envisager des postes d'ingénieurs plus expérimentés.

Et il est important de remédier à cette disparité. Ce n'est pas seulement la diversité pour la diversité. Si les hommes et les femmes sont également intelligents, statistiquement parlant, alors sur les dix personnes les plus intelligentes au monde, cinq devraient être des hommes et cinq devraient être des femmes. Ainsi, si votre équipe est moins qu'un équilibre égal d'hommes et de femmes, votre équipe n'est probablement pas la meilleure possible.

Si votre équipe est moins qu'un équilibre égal d'hommes et de femmes, alors votre équipe n'est probablement pas la meilleure possible.

Dans un système parfait, la diversité est un résultat probabiliste. Mais ce ne sont pas les résultats que nous voyons.

Après avoir entendu cette conversation, je voulais jeter un coup d'œil aux chiffres pour mieux comprendre si / où les tendances de création d'équipes logicielles allaient mal. J'ai cherché sur Google les tendances de la répartition par sexe des niveaux de compétence en génie logiciel, mais je n'ai pas pu trouver grand-chose, alors j'ai décidé de consulter les données accessibles au public sur GitHub. J'ai récupéré 5 000 profils pour obtenir les noms, le nombre d'abonnés, le nombre de contributions et le nombre de référentiels. J'ai ensuite utilisé le package open source genderize.io pour déterminer le sexe de chaque profil.

Il y avait si peu de femmes dans ce premier lot que j'ai dû ajouter plus de données pour que même des graphiques simples soient significatifs, j'en ai donc récupéré 15 000 de plus.

Voici ce que j'ai trouvé :

À quel point l'open source est-il ouvert aux femmes ?

L'Open Source est-il ouvert aux femmes ?
Tweeter

L'open source est dominé par les hommes

Avant même d'entrer dans une analyse plus approfondie, il était évident que le pourcentage de femmes était extrêmement faible. Sur les 20 000 profils, genderize.io a pu déterminer en toute confiance le sexe de 15 374. Parmi ceux-ci, seulement 6,0 % (926) étaient des femmes. La disparité s'aggrave une fois que vous commencez à examiner l'activité des utilisateurs.

Prenons 10 contributions comme limite pour la différence entre un utilisateur qui vient de créer un profil et peut-être un peu expérimenté et celui qui a au moins plongé dans un projet open source ou lancé le sien. Résultat : 5,4 % de femmes.

Seulement 5,4 % des utilisateurs de GitHub avec plus de 10 contributions de notre échantillon aléatoire sont des femmes.
Tweeter

En effet, si l'on divise les utilisateurs en buckets selon leur nombre de contributions (avec un minimum de 1 000 utilisateurs dans chaque bucket), le pourcentage d'utilisatrices a tendance à diminuer au fur et à mesure que les contributions augmentent.

Non seulement il y a beaucoup moins de femmes sur GitHub que ne le suggèrent les chiffres sur la diversité des sexes dans l'industrie technologique, mais il semble que le pourcentage de femmes diminue à mesure que l'activité des utilisateurs augmente.

J'ai continué à creuser, en regardant le genre à travers le nombre d'abonnés et le nombre de référentiels, et j'ai observé la même tendance. Cela était particulièrement clair lorsque l'on regardait le nombre de référentiels :

Encore une fois, nous constatons que le pourcentage de femmes diminue à mesure que nous passons à des seaux avec plus de référentiels.

Alors que se passe-t-il ici ? L'activité GitHub est-elle un indicateur raisonnable de l'expertise en programmation en premier lieu ? (Je pense que oui.) Les ingénieures talentueuses sont-elles moins susceptibles de contribuer activement à l'open source que leurs homologues masculins ? Ces résultats sont-ils un autre indicateur des problèmes d'entrée/de rétention de l'industrie technologique en ce qui concerne les femmes ingénieures ?

Pourquoi les chiffres de la communauté Open Source sont-ils si bas ?

Les chiffres pour les femmes dans l'industrie technologique sont déjà assez sombres, mais ils sont encore pires dans les projets open source.

De nombreuses recherches antérieures se sont concentrées sur les raisons pour lesquelles les femmes ne sont pas disposées à se lancer dans des matières et des carrières liées aux STEM. Certains concluent à un manque général d'intérêt pour les matières STEM. D'autres pensent que les femmes décident de ne pas poursuivre de carrière dans les STEM après avoir été stéréotypées par leur famille et leurs enseignants. D'autres encore citent un manque de modèles ou une combinaison de causes multiples.

Selon une étude sur le genre dans StackOverflow, "La question du genre et des sujets liés aux STEM est étudiée depuis plusieurs années, et principalement du point de vue du" pourquoi "les femmes ne s'engagent pas dans des études ou des carrières scientifiques. Jusqu'à présent, une attention moindre a été accordée à la quantification du phénomène et de la représentation des femmes dans les communautés en ligne (en tant qu'"utilisatrices" de la technologie), à ​​leurs niveaux de participation et à la détection de différences au niveau du genre. Seules des preuves anecdotiques ont été recueillies sur la manière dont des communautés spécifiques découragent activement les femmes de participer.

Mais lorsque nous passons autant de temps à nous concentrer sur les raisons pour lesquelles il y a moins de femmes poursuivant des matières liées aux STEM, nous perdons de vue une autre disparité importante : si 28 % des diplômes de maîtrise en informatique sont décernés à des femmes, pourquoi le nombre de la communauté open source est-il si important ? plus bas?

Il y a quelques possibilités à considérer lorsque vous réfléchissez à une réponse à cette question :

1. Peut-être qu'il n'y a pas de forte corrélation entre les talents de programmation et l'activité GitHub.

Dans l'industrie technologique, de nombreux développeurs se tournent vers GitHub au début de leur carrière car c'est une condition préalable à prendre au sérieux. Cependant, il semble que moins de développeurs féminins en herbe voient l'open source de cette façon. Est-il possible que ces données soient toutes fortuites et ne signifient pas grand-chose par rapport au nombre d'ingénieures logicielles talentueuses dans l'industrie technologique ?

J'ai discuté de la question avec deux ingénieurs de Toptal, Anna-Chiara Bellini et Bozhidar Batsov. Anna-Chiara a plus de 20 ans d'expérience en génie logiciel dans divers contextes universitaires et commerciaux, et Bozhidar est numéro 98 sur la liste des contributeurs GitHub les plus actifs au monde.

Tous deux ont convenu que si être actif sur GitHub est généralement un bon indicateur de l'expertise en ingénierie, l'inverse n'est pas vrai, mentionnant qu'ils connaissent de nombreux grands ingénieurs qui ne sont pas du tout impliqués dans l'open source. L'industrie technologique est également d'accord, de nombreuses entreprises évaluant les profils GitHub lors des processus d'embauche (bien que cette pratique semble assez biaisée, ce qui n'est pas vraiment une surprise compte tenu des résultats de mon étude).

L'activité GitHub est généralement un bon indicateur de l'expertise en ingénierie, mais l'inverse n'est pas vrai… Beaucoup de grands ingénieurs ne sont pas sur GitHub.
Tweeter

Bozhidar a suggéré que les contributeurs open source sont souvent plus susceptibles d'être le type de personnes qui poussent à de grands changements internes dans le cadre d'une entreprise. Anna-Chiara a déclaré qu'il fallait beaucoup de confiance pour contribuer à l'open source, ce qu'elle pensait être plus difficile à surmonter pour les femmes développeurs, étant donné la mauvaise histoire de l'industrie technologique avec l'accueil des femmes.

Il y a certainement plusieurs biais qui pourraient potentiellement être en jeu avec ces données GitHub (y compris le fait que près de 25 % des noms n'ont pas pu être classés comme masculins/féminins avec confiance).

Cependant, Bozhidar, Anna-Chiara et moi-même avons convenu que le niveau d'activité de GitHub est généralement un bon indicateur de l'expertise en programmation. Pourtant, ces données suggèrent une tendance des programmeuses talentueuses à choisir d'arrêter (ou de ne jamais commencer) leurs activités open source en faveur d'autres options.

2. Les chiffres cités dans les rapports des entreprises technologiques incluent des rôles non technologiques.

De nombreuses entreprises du secteur de la technologie indiquent qu'elles emploient entre 25 et 30 % de femmes. Ce chiffre peut cependant être trompeur. La plupart de ces grands nombres - oui, ce sont les plus grands - comprennent à la fois des rôles techniques et non techniques.

Lorsque vous commencez à examiner le pourcentage d'employées occupant des postes techniques, les chiffres chutent encore plus.

Chez Facebook, 32 % des employés sont des femmes, mais seulement 16 % des postes techniques appartiennent à des femmes. Chez Google, il y a une baisse similaire de 30 % des femmes employées dans l'ensemble de l'entreprise à 18 % dans les rôles techniques. Slack passe de 39 % de femmes dans l'ensemble à 18 % dans les rôles d'ingénierie. Parmi les entreprises que j'ai examinées, Intel a le plus petit saut, passant de 24,1 % de femmes dans l'ensemble à 19,4 % dans les rôles techniques.

Ainsi, même si de nombreuses entreprises affichent un pourcentage d'employées féminines qui représente environ un quart, voire un tiers de l'entreprise, le nombre de femmes occupant des postes techniques est en fait beaucoup plus faible. Il semble que des revendications de 15 à 20 % seraient plus précises.

Mais cela laisse toujours une énorme disparité entre le pourcentage de femmes impliquées dans des rôles techniques ou d'ingénierie dans des entreprises technologiques et le pourcentage de femmes qui contribuent à des projets open source sur GitHub.

3. Les programmeuses quittent l'industrie technologique.

Si l'activité sur GitHub est corrélée à l'ancienneté et à l'expertise, alors le nombre extrêmement faible de contributrices actives (faible même par rapport à l'ensemble des contributrices) pourrait s'expliquer par le taux de départ alarmant des femmes ingénieures de l'industrie technologique.

Parmi les femmes qui rejoignent l'industrie technologique, 56 % partent à mi-carrière, soit le double du taux d'attrition des hommes.
Tweeter

Si l'industrie technologique ne peut pas retenir autant de femmes après la mi-carrière, il est probable qu'elles ne contribueront pas non plus à de nombreux projets open source.

Mais ce raisonnement soulève également la question suivante : la corrélation entre l'ancienneté et la contribution est-elle réellement vraie ? De nombreux contributeurs OSS fréquents sont des programmeurs relativement nouveaux qui essaient de se faire un nom - alors où sont les femmes de ce groupe ?

4. GitHub peut être une communauté peu accueillante pour les programmeuses.

Commentant un article sur les femmes dans la technologie, une développeuse déclare : « En ce qui concerne les projets open source, j'y ai pensé récemment. En fait, je ne me suis engagé à aucun et cela met définitivement un tournant dans ma carrière… J'ai l'impression que c'est un cercle dans lequel je ne peux pas entrer. Mais surtout, je crains les projecteurs excessifs d'être une seule femme programmeuse sur un projet accessible au public. À la lumière de la façon dont les femmes sont traitées sur Internet, cette peur ne semble pas déraisonnable.

Anna-Chiara pense que ce type d'appréhension est un thème commun chez les femmes ingénieures, en particulier lorsqu'il s'agit d'OSS. Quand je lui ai demandé si elle pensait que les femmes étaient moins susceptibles de contribuer à des projets open source, elle a répondu, sans hésitation, oui.

Anna-Chiara a également évoqué la possibilité que les utilisatrices de GitHub essaient d'adopter un nom non sexiste ou masculin pour s'assurer qu'elles seraient prises au sérieux (rappelez-vous que genderize.io n'a pas été en mesure de déterminer avec certitude le sexe d'environ un quart des profils grattés).

Cela ne signifie pas pour autant qu'il n'y a pas de contributrices. Bozidhar évoque Exercism.io, un projet populaire lancé par Katrina Owen qui compte plusieurs contributeurs féminins. Il mentionne également Bodil Stokke, une développeuse norvégienne avec une histoire extrêmement étendue de contributions open source populaires.

Anna-Chiara suggère également que si un projet avait des femmes parmi les principaux contributeurs ou leaders, les femmes développeurs pourraient être plus susceptibles d'y contribuer. Malheureusement, par rapport au nombre de projets à prédominance masculine, les projets OSS dirigés par des femmes sont difficiles à trouver.

Mais le problème est plus vaste que le simple OSS. « Si je pense aux femmes que je connais dans le développement, c'est loin des 20 % dont vous entendez parler dans ces grandes entreprises. Je ne pense même pas que ce soit près de 10 % », me dit Anna-Chiara. "Le résultat de cette analyse de GitHub ne me surprend pas."

5. Les préjugés implicites qui façonnent l'industrie technologique pourraient se répercuter sur GitHub.

Eric Ries pointe du doigt les problèmes de biais implicites dans l'industrie technologique. Même si les personnes individuelles au sein des systèmes ne sont pas biaisées, il est toujours extrêmement facile pour ces systèmes de devenir biaisés. Les gens ont aussi des préjugés inconscients, ce qui complique encore plus le problème.

Dans son article, Eric prend l'exemple des orchestres, majoritairement masculins jusque dans les années 1970. Les gens croyaient que les interprètes masculins avaient une aptitude supérieure pour la musique que les interprètes féminines. Cependant, une fois que les orchestres ont commencé à séparer les musiciens des juges avec un écran physique lors des auditions, les chiffres ont considérablement changé et les gens ont commencé à accepter que les hommes et les femmes jouaient aussi bien en moyenne.

Si des préjugés similaires entrent en jeu avec les systèmes d'embauche dans l'industrie technologique, cela pourrait aider à expliquer le pourcentage plus faible d'ingénieures en logiciel dont j'ai parlé plus tôt. Et si moins d'ingénieures en logiciel sont embauchées, ces effets pourraient se répercuter sur les communautés open source comme GitHub. Si quelqu'un est rejeté pour des rôles de programmation à temps plein, il pourrait en venir à croire qu'il n'est pas aussi talentueux et serait donc moins susceptible d'avoir la confiance nécessaire pour contribuer à des projets open source.

Où cela nous mène-t-il ?

Voici quelques questions complémentaires qui me viennent à l'esprit (et il y en a bien d'autres) :

1. Comment ces chiffres évoluent-ils dans le temps ?

Faire participer davantage de femmes à l'industrie technologique est un sujet très discuté en ce moment, et la montée en puissance des bootcamps de codage qui nécessitent des contributions devrait avoir un impact positif, y compris en ce qui concerne l'open source. Quelle est l'efficacité de ces discussions et des diverses nouvelles initiatives? A quoi ressembleraient ces chiffres il y a 3 ans ? il y a 5 ans? Et dans un an ?

2. Comment pouvons-nous analyser les données GitHub autrement ?

Anna-Chiara a suggéré d'examiner la répartition par sexe des utilisateurs en fonction du nombre de fourches dont ils disposent pour avoir une idée de la fréquence à laquelle les utilisatrices de GitHub expérimentent un projet d'une manière ou d'une autre. De plus, il existe d'autres facteurs en jeu, tels que le groupe d'âge, qui pourraient affecter nos résultats. L'open source est depuis longtemps un incontournable de l'industrie technologique, mais GitHub n'a été fondé qu'en 2008.

3. Existe-t-il un bon moyen de voir quels utilisateurs de GitHub utilisent un faux nom ?

Si le pourcentage de femmes qui utilisent un faux nom est beaucoup plus élevé que le pourcentage de femmes sur GitHub dans son ensemble, cela ferait une déclaration très forte sur l'accueil de GitHub (et de la technologie en général, dans une certaine mesure) en tant que communauté.

4. Comment ces chiffres changent-ils lorsque vous commencez à regarder l'emplacement ?

Ceci est imparfait, car l'interaction sur GitHub est théoriquement indépendante de l'emplacement. Mais pouvons-nous apprendre quelque chose des communautés technologiques dans les pays qui ont une proportion d'utilisatrices de GitHub supérieure à la moyenne.

Et voici quelques idées pour améliorer ces chiffres (encore une fois, il y en a bien d'autres) :

1. Les pages des référentiels GitHub populaires peuvent-elles être améliorées ?

Lorsque j'ai discuté de ce sujet avec Bozhidar, il a mentionné que la plupart des projets/communautés sur GitHub ont des dirigeants extrêmement patients, accueillants et heureux de guider les nouveaux contributeurs open source tout au long des premières étapes du projet. Cela ne semble pas du tout être de notoriété publique (rappelez-vous le commentaire susmentionné d'une femme développeur qui pensait que les communautés open source étaient "un cercle [dans lequel elle ne pouvait pas] entrer").

Les nouveaux utilisateurs de GitHub savent-ils que ce type de mentorat et de soutien existe (en supposant qu'il soit aussi répandu qu'il le dit), et un nouvel utilisateur saurait-il comment trouver facilement de tels conseils ? Des améliorations pourraient-elles être apportées aux interfaces des référentiels GitHub populaires pour rendre cela plus évident et les rendre plus accueillants ? Par exemple, si les pages de référentiel populaires incluaient quelque chose comme un rôle officiel de «mentor de référentiel», il serait peut-être beaucoup plus clair qu'un utilisateur accueillant et expérimenté soit disponible pour répondre à toutes les questions.

2. Publiez de meilleurs guides (et plus répandus) « Premiers pas avec GitHub ».

Il existe de nombreux articles qui vous apprennent à utiliser GitHub en vous guidant à travers les pulls / pushs, les commits, les branchements, etc., mais je ne trouve presque rien en termes de directives pour interagir au sein de la communauté GitHub (si vous connaissez tout, s'il vous plaît poster des liens pertinents dans les commentaires).

Un guide pratique pour naviguer dans l'étiquette de la communauté GitHub et les meilleures pratiques en fonction de votre niveau de compétence pourrait aider à briser les éléments d'intimidation et à mettre en lumière les éléments de contribution à l'open source. C'est certainement quelque chose qui pourrait encourager davantage de nouveaux développeurs en herbe à s'impliquer. Restez à l'écoute pour un guide comme celui-ci de Toptal.

3. Plus de mentorat pourrait faire une énorme différence.

Bozhidar a commenté l'importance des développeurs impliqués dans le projet qui étaient prêts à aider les nouveaux arrivants à démarrer avec des tâches de base, tandis qu'Anna-Chiara a expliqué à quel point il pouvait être assez intimidant de se lancer dans un projet et d'ouvrir votre travail à la critique. Il semble qu'il y ait beaucoup à faire pour rendre les communautés open source plus accueillantes pour tout le monde, y compris les femmes. Restez à l'écoute pour une initiative de Toptal ici aussi !

Êtes-vous surpris par les résultats de GitHub ? Que pensez-vous qu'ils signifient?