O código aberto é aberto às mulheres?

Publicados: 2022-03-11

O seguinte foi publicado antes do lançamento do Toptal Scholarships for Female Developers. Para apoiar os candidatos a bolsas de estudo, a Toptal também publicou um guia para fazer sua primeira contribuição de código aberto.

As mulheres estão sub-representadas na tecnologia. Essa percepção não é novidade. Basta olhar para os números divulgados pelo Facebook, Google, Intel, Slack e muitos, muitos mais. Mas os números podem ser ainda piores do que esses relatórios sugerem.

Em um evento de tecnologia recente, ouvi uma conversa paralela sobre a falta de diversidade de gênero na tecnologia. O pequeno grupo estava discutindo o fato de que, embora as mulheres representem cerca de 30% da força de trabalho em tecnologia, as equipes de engenharia de nível superior raramente têm mais do que algumas mulheres.

Um dos participantes desta conversa comentou que isso ocorreu porque os desenvolvedores do sexo masculino são geralmente mais talentosos do que os desenvolvedores do sexo feminino. Ninguém do grupo se opôs.

Hmm…

Pela experiência pessoal na Toptal e minha experiência universitária em engenharia em Princeton, que era quase 50/50 entre homens e mulheres, sei que isso é falso. Trabalhei com várias engenheiras incríveis e profundamente inteligentes em todos os tipos de funções. No entanto, os números não parecem corresponder à minha própria experiência, especialmente quando você começa a olhar para cargos mais altos de engenharia.

E abordar essa disparidade é importante. Não é apenas a diversidade pela diversidade. Se homens e mulheres são igualmente inteligentes, estatisticamente falando, então das dez pessoas mais inteligentes do mundo, cinco deveriam ser homens e cinco deveriam ser mulheres. Assim, se a sua equipe é algo menos do que um equilíbrio igual de homens e mulheres, então sua equipe provavelmente não é a melhor que pode ser.

Se a sua equipe é menos do que um equilíbrio igual de homens e mulheres, então sua equipe provavelmente não é a melhor que pode ser.

Em um sistema perfeito, a diversidade é um resultado probabilístico. Mas estes não são os resultados que estamos vendo.

Depois de ouvir essa conversa, eu queria dar uma olhada nos números para entender melhor se/onde as tendências de desenvolvimento de equipes de software estavam dando errado. Pesquisei no Google por tendências na divisão de gênero entre os níveis de habilidade em engenharia de software, mas não consegui encontrar muita coisa, então decidi examinar os dados disponíveis publicamente no GitHub. Raspei 5.000 perfis para obter nomes, número de seguidores, número de contribuições e número de repositórios. Em seguida, usei o pacote de código aberto genderize.io para descobrir o sexo de cada perfil.

Havia tão poucas mulheres neste primeiro lote que tive que adicionar mais dados para tornar até mesmo gráficos simples significativos, então raspei mais 15.000.

Aqui está o que eu encontrei:

Quão aberto é o código aberto para as mulheres?

O código aberto é aberto às mulheres?
Tweet

O código aberto é dominado por homens

Mesmo antes de entrar em qualquer análise mais aprofundada, era óbvio que a porcentagem de mulheres era extremamente baixa. Dos 20.000 perfis, o genderize.io conseguiu determinar com confiança o gênero de 15.374. Desses, apenas 6,0% (926) eram mulheres. A disparidade fica mais grave quando você começa a observar a atividade do usuário.

Vamos pegar 10 contribuições como o ponto de corte para a diferença entre um usuário que acabou de criar um perfil e talvez experimentou um pouco e um que pelo menos se aprofundou em um projeto de código aberto ou iniciou seu próprio. O resultado: 5,4% mulheres.

Apenas 5,4% dos usuários do GitHub com mais de 10 contribuições de nossa amostra aleatória são mulheres.
Tweet

De fato, se dividirmos os usuários em grupos de acordo com o número de contribuições (com um mínimo de 1.000 usuários em cada grupo), o percentual de mulheres tende a diminuir à medida que as contribuições aumentam.

Não apenas há muito menos mulheres no GitHub do que os números de diversidade de gênero da indústria de tecnologia podem sugerir, mas parece que a porcentagem de mulheres diminui à medida que a atividade do usuário aumenta.

Continuei cavando, analisando o gênero através do número de seguidores e número de repositórios, e observei a mesma tendência. Isso ficou especialmente claro ao analisar o número de repositórios:

Novamente, vemos que a porcentagem de fêmeas diminui à medida que passamos para buckets com mais repositórios.

Então o que está acontecendo aqui? A atividade do GitHub é um indicador razoável de experiência em programação em primeiro lugar? (Acho que sim.) As engenheiras talentosas são menos propensas a contribuir ativamente para o código aberto do que seus colegas homens? Esses resultados são outro indicador dos problemas de entrada/retenção da indústria de tecnologia quando se trata de engenheiras?

Por que os números na comunidade de código aberto são tão baixos?

Os números para as mulheres na indústria de tecnologia já são bastante sombrios, mas são ainda piores em projetos de código aberto.

Muitas pesquisas anteriores se concentraram nas razões pelas quais as mulheres não estão dispostas a embarcar em assuntos e carreiras relacionadas a STEM. Alguns concluem uma falta geral de interesse em assuntos STEM. Outros acreditam que as mulheres decidem não seguir carreiras STEM depois de serem estereotipadas pela família e pelos professores. Outros ainda citam a falta de modelos ou uma combinação de múltiplas causas.

De acordo com um estudo sobre gênero no StackOverflow, “A questão de gênero e assuntos relacionados a STEM tem sido estudada há vários anos, e principalmente do ponto de vista de 'por que' as mulheres não se envolvem em estudos científicos ou carreiras. Menos atenção tem sido dada até agora para quantificar o fenômeno e a representação das mulheres nas comunidades online (como 'usuárias' de tecnologia), quais são seus níveis de participação e se as diferenças podem ser detectadas no nível de gênero. Apenas evidências anedóticas foram coletadas sobre como comunidades específicas desencorajam ativamente a participação das mulheres”.

Mas quando passamos tanto tempo focando em por que há menos mulheres cursando assuntos relacionados a STEM, perdemos o foco em outra importante disparidade: se 28% dos mestrados em CS vão para mulheres, por que os números na comunidade de código aberto são tão mais baixo?

Existem algumas possibilidades a serem consideradas ao pensar em uma resposta para esta pergunta:

1. Talvez não haja uma forte correlação entre o talento de programação e a atividade do GitHub.

No setor de tecnologia, muitos desenvolvedores acessam o GitHub no início de suas carreiras, pois é um pré-requisito a ser levado a sério. No entanto, parece que menos desenvolvedores mulheres aspirantes veem o código aberto dessa maneira. É possível que todos esses dados sejam coincidentes e não signifiquem muito em relação ao número de talentosas engenheiras de software na indústria de tecnologia?

Discuti a questão com dois engenheiros da Toptal, Anna-Chiara Bellini e Bozhidar Batsov. Anna-Chiara tem mais de 20 anos de experiência em engenharia de software em uma variedade de ambientes acadêmicos e de negócios, e Bozhidar é o número 98 na lista dos contribuidores mais ativos do GitHub no mundo.

Ambos concordaram que, embora estar ativo no GitHub seja normalmente um bom indicador de experiência em engenharia, o inverso não é verdadeiro, mencionando que eles conhecem muitos grandes engenheiros que não estão envolvidos em código aberto. A indústria de tecnologia também concorda, com muitas empresas avaliando os perfis do GitHub durante os processos de contratação (embora essa prática pareça bastante tendenciosa, o que não é realmente uma surpresa, considerando os resultados do meu estudo).

A atividade do GitHub geralmente é um bom indicador de experiência em engenharia, mas o inverso não é verdade... Muitos grandes engenheiros não estão no GitHub.
Tweet

Bozhidar sugeriu que os contribuidores de código aberto geralmente são mais propensos a ser o tipo de pessoa que pressiona por grandes mudanças internas no ambiente da empresa. Anna-Chiara comentou que é preciso muita confiança para contribuir com o código aberto, algo que ela acha que pode ser mais difícil para as desenvolvedoras do sexo feminino superarem, dado o histórico ruim da indústria de tecnologia em acolher mulheres.

Certamente existem vários vieses que podem estar em jogo com esses dados do GitHub (incluindo o fato de que quase 25% dos nomes não podem ser classificados como masculino/feminino com confiança).

No entanto, Bozhidar, Anna-Chiara e eu concordamos que o nível de atividade do GitHub é geralmente um bom indicador de experiência em programação. No entanto, esses dados sugerem uma tendência de programadoras talentosas optarem por descontinuar (ou nunca iniciar) suas atividades de código aberto em favor de outras opções.

2. Os números citados em relatórios de empresas de tecnologia incluem funções não relacionadas à tecnologia.

Muitas empresas do setor de tecnologia citam que empregam entre 25 e 30 por cento de mulheres. Esse número, no entanto, pode ser enganoso. A maioria desses números maiores - sim, eles são os maiores - incluem funções técnicas e não técnicas.

À medida que você começa a examinar a porcentagem de funcionárias em cargos técnicos, os números caem ainda mais.

No Facebook, 32% dos funcionários são do sexo feminino, mas apenas 16% dos cargos técnicos pertencem a mulheres. No Google, há uma queda semelhante de 30% de funcionárias na empresa como um todo para 18% em cargos técnicos. O Slack cai de 39% de mulheres no geral para 18% em cargos de engenharia. Das empresas que examinei, a Intel tem o menor salto, passando de 24,1% de mulheres em geral para 19,4% em cargos técnicos.

Portanto, embora muitas empresas tenham uma porcentagem de funcionários do sexo feminino que é cerca de um quarto ou até um terço da empresa, o número de mulheres em cargos técnicos é realmente muito menor. Parece que afirmações de 15 a 20 por cento seriam mais precisas.

Mas isso ainda deixa uma enorme disparidade entre a porcentagem de mulheres envolvidas em funções técnicas ou de engenharia em empresas de tecnologia e a porcentagem de mulheres que contribuem para projetos de código aberto no GitHub.

3. Programadoras estão deixando a indústria de tecnologia.

Se a atividade no GitHub se correlaciona com a antiguidade e a experiência, o número extremamente baixo de colaboradoras ativas (baixo mesmo em comparação com as colaboradoras em geral) pode ser explicado pela taxa de saída alarmantemente alta de engenheiras do setor de tecnologia.

Entre as mulheres que ingressam na indústria de tecnologia, 56% saem no meio da carreira, o dobro da taxa de atrito para os homens.
Tweet

Se a indústria de tecnologia não consegue reter tantas mulheres após a metade da carreira, é provável que elas também não contribuam para muitos projetos de código aberto.

Mas essa linha de raciocínio também levanta a questão: a correlação entre antiguidade e contribuição é realmente verdadeira? Muitos contribuidores frequentes de OSS são programadores relativamente novos que estão tentando estabelecer um nome para si mesmos - então, onde estão as mulheres desse grupo?

4. O GitHub pode ser uma comunidade pouco acolhedora para programadoras.

Comentando um artigo sobre mulheres na tecnologia, uma desenvolvedora disse: “Em relação aos projetos de código aberto - estive pensando nisso recentemente. Na verdade, eu não me comprometi com nenhum e isso definitivamente coloca uma torção na minha carreira... Eu sinto que é um círculo no qual não posso entrar. Mas principalmente temo o excesso de holofotes de ser uma única programadora em um projeto disponível publicamente. À luz de como as mulheres são tratadas na internet, esse medo não parece irracional.”

Anna-Chiara acredita que esse tipo de apreensão é um tema comum entre as engenheiras, especialmente quando se trata de OSS. Quando perguntei a ela se ela achava que as mulheres eram menos propensas a contribuir para projetos de código aberto, ela respondeu, sem hesitar, que sim.

Anna-Chiara também levantou a possibilidade de que as usuárias do GitHub tentem adotar um nome de gênero neutro ou masculino para garantir que sejam levados a sério (lembre-se de que o genderize.io não foi capaz de determinar com confiança o gênero de cerca de um quarto dos perfis raspados).

Isso não significa, no entanto, que as mulheres colaboradoras não estejam por aí. Bozidhar traz o Exercism.io, um projeto popular iniciado por Katrina Owen que tem várias colaboradoras do sexo feminino. Ele também menciona Bodil Stokke, uma desenvolvedora da Noruega com um histórico extremamente extenso de contribuições populares de código aberto.

Anna-Chiara também sugere que, se um projeto tivesse mulheres entre os principais colaboradores ou líderes, as desenvolvedoras teriam maior probabilidade de contribuir para ele. Infelizmente, em comparação com o número de projetos dominados por homens, projetos de OSS liderados por mulheres são difíceis de encontrar.

Mas a questão é maior do que apenas OSS. “Se eu pensar nas mulheres que conheço no desenvolvimento, não chega nem perto dos 20% que você ouve falar nessas grandes empresas. Acho que não chega nem perto de 10%”, Anna-Chiara me diz. “O resultado desta análise do GitHub não me surpreende.”

5. Preconceitos implícitos que moldam a indústria de tecnologia podem estar chegando ao GitHub.

Eric Ries aponta problemas de preconceitos implícitos na indústria de tecnologia. Mesmo que as pessoas individuais dentro dos sistemas não sejam tendenciosas, ainda é extremamente fácil para esses sistemas se tornarem tendenciosos. As pessoas também têm preconceitos inconscientes, o que complica ainda mais a questão.

Em seu artigo, Eric usa o exemplo das orquestras, que eram principalmente masculinas até a década de 1970. As pessoas acreditavam que os artistas do sexo masculino tinham uma aptidão superior para a música do que as mulheres. No entanto, uma vez que as orquestras começaram a separar os músicos dos juízes com uma tela física durante as audições, os números mudaram significativamente e as pessoas começaram a aceitar que homens e mulheres tocavam igualmente bem em média.

Se vieses semelhantes entrarem em jogo com os sistemas de contratação no setor de tecnologia, isso pode ajudar a explicar a porcentagem menor de engenheiras de software do sexo feminino que discuti anteriormente. E se menos engenheiras de software forem contratadas, esses efeitos podem se espalhar para comunidades de código aberto como o GitHub. Se alguém for rejeitado para funções de programação em tempo integral, eles podem acreditar que não são tão talentosos e, portanto, seriam menos propensos a ter confiança para contribuir com projetos de código aberto.

Onde isso nos deixa?

Aqui estão algumas perguntas de acompanhamento que me vêm à mente (e há muito mais):

1. Como esses números estão mudando ao longo do tempo?

Envolver mais mulheres na indústria de tecnologia é um tópico altamente discutido no momento, e o surgimento de bootcamps de codificação que exigem contribuições deve ter um impacto positivo, inclusive quando se trata de código aberto. Quão eficazes são essas discussões e as várias novas iniciativas? Como seriam esses números 3 anos atrás? 5 anos atrás? E em um ano?

2. De que outra forma podemos analisar os dados do GitHub?

Anna-Chiara sugeriu examinar a divisão de gênero dos usuários com base no número de bifurcações que eles têm para ter uma ideia de com que frequência as usuárias do GitHub estão experimentando um projeto de alguma forma. Além disso, existem outros fatores em jogo, como a faixa etária, que podem afetar nossos achados. O código aberto é um marco na indústria de tecnologia há muito tempo, mas o GitHub foi fundado apenas em 2008.

3. Existe uma boa maneira de ver quais usuários do GitHub estão empregando um nome falso?

Se a porcentagem de mulheres que usam um nome falso for muito maior do que a porcentagem de mulheres no GitHub em geral, isso seria uma afirmação muito forte sobre como o GitHub é receptivo (e a tecnologia em geral, até certo ponto) como uma comunidade.

4. Como esses números mudam quando você começa a olhar para a localização?

Isso é imperfeito, pois a interação no GitHub é teoricamente independente de localização. Mas podemos aprender alguma coisa com as comunidades de tecnologia em países que têm uma proporção de usuários femininos do GitHub superior à média.

E aqui estão algumas ideias para melhorar esses números (novamente, é claro que há muito mais):

1. As páginas de repositórios populares do GitHub podem ser melhoradas?

Quando discuti esse tópico com Bozhidar, ele mencionou que a maioria dos projetos/comunidades no GitHub tem líderes extremamente pacientes, receptivos e felizes em orientar novos contribuidores de código aberto nos estágios iniciais do projeto. Isso não parece ser de conhecimento comum (lembre-se do comentário acima mencionado de uma desenvolvedora que sentiu que as comunidades de código aberto eram “um círculo [que ela não conseguia] entrar”).

Os novos usuários do GitHub estão cientes de que esse tipo de orientação e suporte existe (supondo que seja tão prevalente quanto ele diz) e um novo usuário saberia como encontrar facilmente essa orientação? Poderiam ser feitas melhorias nas interfaces de repositórios populares do GitHub para tornar isso mais óbvio e torná-los mais acolhedores? Por exemplo, se as páginas populares do repositório incluíssem algo como uma função oficial de “Mentor de Repositório”, talvez ficasse muito mais claro que um usuário experiente e acolhedor estivesse disponível para responder a quaisquer perguntas.

2. Publique guias de “Introdução ao GitHub” melhores (e mais prevalentes).

Existem muitas postagens por aí que ensinam como usar o GitHub, orientando você por pull/pushes, commits, ramificações e muito mais, mas não encontro quase nada em termos de diretrizes para interagir dentro da comunidade GitHub (se você souber de qualquer, por favor poste links relevantes nos comentários).

Um guia de instruções para navegar na etiqueta da comunidade do GitHub e nas práticas recomendadas de acordo com seu nível de habilidade pode ajudar a quebrar os elementos de intimidação e destaque de contribuir para o código aberto. Isso é definitivamente algo que poderia encorajar novos desenvolvedores mais aspirantes a se envolverem. Fique atento a um guia como este da Toptal.

3. Mais orientação pode fazer uma enorme diferença.

Bozhidar comentou sobre a importância dos desenvolvedores envolvidos no projeto que estavam dispostos a ajudar os recém-chegados a começarem com tarefas básicas, enquanto Anna-Chiara discutiu como poderia ser bastante intimidante entrar em um projeto e abrir seu trabalho para críticas. Parece que há muito que pode ser feito para tornar as comunidades de código aberto mais acolhedoras para todos, incluindo as mulheres. Fiquem atentos a uma iniciativa da Toptal aqui também!

Você está surpreso com os resultados do GitHub? O que você acha que eles querem dizer?