¿El código abierto está abierto a las mujeres?

Publicado: 2022-03-11

Lo siguiente se publicó antes del lanzamiento de las Becas Toptal para mujeres desarrolladoras. Para apoyar a los solicitantes de becas, Toptal también ha publicado una guía para hacer su primera contribución de código abierto.

Las mujeres están subrepresentadas en la tecnología. Esta realización no es nada nuevo. Solo mire los números publicados por Facebook, Google, Intel, Slack y muchos, muchos más. Pero los números podrían ser incluso peores de lo que implican estos informes.

En un evento tecnológico reciente, escuché una conversación paralela sobre la falta de diversidad de género en la tecnología. El pequeño grupo discutía el hecho de que, aunque las mujeres representan alrededor del 30 % de la fuerza laboral en tecnología, los equipos de ingeniería de nivel superior rara vez cuentan con más de unas pocas mujeres.

Uno de los participantes en esta conversación comentó que esto se debía a que los desarrolladores masculinos generalmente son más talentosos que las desarrolladoras femeninas. Nadie en el grupo se opuso.

Mmm…

Por experiencia personal en Toptal y mi experiencia universitaria en ingeniería en Princeton, que fue casi 50/50 hombres contra mujeres, sé que esto es falso. He trabajado con varias ingenieras increíbles y profundamente inteligentes en todo tipo de funciones. Sin embargo, los números no parecen coincidir con mi propia experiencia, especialmente cuando comienzas a buscar roles de ingeniería más senior.

Y abordar esta disparidad es importante. No se trata sólo de la diversidad por el bien de la diversidad. Si los hombres y las mujeres son igualmente inteligentes, estadísticamente hablando, entonces de las diez personas más inteligentes del mundo, cinco deberían ser hombres y cinco mujeres. Por lo tanto, si su equipo es algo menos que un equilibrio igualitario de hombres y mujeres, entonces su equipo probablemente no sea el mejor que pueda ser.

Si su equipo es algo menos que un equilibrio equitativo de hombres y mujeres, entonces su equipo probablemente no sea el mejor que pueda ser.

En un sistema perfecto, la diversidad es un resultado probabilístico. Pero estos no son los resultados que estamos viendo.

Después de escuchar esta conversación, quería echar un vistazo a los números para comprender mejor si las tendencias de creación de equipos de software estaban fallando y dónde. Busqué en Google las tendencias en el desglose por género en los niveles de habilidad en ingeniería de software, pero no pude encontrar mucho, así que decidí mirar los datos disponibles públicamente en GitHub. Extraje 5000 perfiles para obtener nombres, número de seguidores, número de contribuciones y número de repositorios. Luego usé el paquete de código abierto genderize.io para averiguar el género de cada perfil.

Había tan pocas mujeres en este primer lote que tuve que agregar más datos para que incluso los gráficos simples fueran significativos, así que eliminé 15,000 más.

Esto es lo que encontré:

¿Qué tan abierto es el código abierto para las mujeres?

¿El código abierto está abierto a las mujeres?
Pío

El código abierto está dominado por hombres

Incluso antes de entrar en más análisis, era obvio que el porcentaje de mujeres era extremadamente bajo. De los 20.000 perfiles, genderize.io pudo determinar con confianza el género de 15.374. De ellos, solo el 6,0% (926) eran mujeres. La disparidad se vuelve más severa una vez que comienzas a observar la actividad del usuario.

Tomemos 10 contribuciones como el límite para la diferencia entre un usuario que acaba de crear un perfil y tal vez experimentó un poco y uno que al menos profundizó en un proyecto de código abierto o comenzó el suyo propio. El resultado: 5,4% mujeres.

Solo el 5,4 % de los usuarios de GitHub con más de 10 contribuciones de nuestra muestra aleatoria son mujeres.
Pío

De hecho, si dividimos a los usuarios en cubos según su número de cotizaciones (con un mínimo de 1.000 usuarios en cada cubo), el porcentaje de usuarias tiende a disminuir a medida que aumentan las cotizaciones.

No solo hay muchas menos mujeres en GitHub de lo que podrían sugerir las cifras de diversidad de género de la industria tecnológica, sino que parece que el porcentaje de mujeres disminuye a medida que aumenta la actividad de los usuarios.

Seguí investigando, observando el género a través de la cantidad de seguidores y la cantidad de repositorios, y observé la misma tendencia. Esto fue especialmente claro al observar la cantidad de repositorios:

De nuevo, vemos que el porcentaje de hembras disminuye a medida que avanzamos a cubos con más repositorios.

Entonces, ¿qué está pasando aquí? ¿Es la actividad de GitHub un indicador razonable de la experiencia en programación en primer lugar? (Creo que lo es). ¿Es menos probable que las ingenieras talentosas contribuyan activamente al código abierto que sus contrapartes masculinas? ¿Son estos resultados otro indicador de los problemas de entrada/retención de la industria tecnológica cuando se trata de mujeres ingenieras?

¿Por qué los números en la comunidad de código abierto son tan bajos?

Los números para las mujeres en la industria de la tecnología ya son bastante sombríos, pero son aún peores en los proyectos de código abierto.

Muchas investigaciones anteriores se han centrado en las razones por las que las mujeres no están dispuestas a embarcarse en materias y carreras relacionadas con STEM. Algunos concluyen una falta general de interés en las materias STEM. Otros creen que las mujeres deciden no seguir carreras STEM después de haber sido estereotipadas por la familia y los maestros. Otros más citan la falta de modelos a seguir o una combinación de múltiples causas.

Según un estudio sobre género en StackOverflow, “El tema de género y temas relacionados con STEM se ha estudiado durante varios años, y principalmente desde el punto de vista de 'por qué' las mujeres no se involucran en estudios o carreras científicas. Hasta ahora se ha prestado menos atención a cuantificar el fenómeno y la representación de las mujeres en las comunidades en línea (como 'usuarias' de tecnología), cuáles son sus niveles de participación y si se pueden detectar diferencias a nivel de género. Solo se ha recopilado evidencia anecdótica sobre cómo comunidades específicas desalientan activamente a las mujeres a participar”.

Pero cuando pasamos tanto tiempo enfocándonos en por qué hay menos mujeres que buscan temas relacionados con STEM, perdemos el enfoque en otra disparidad importante: si el 28% de las maestrías en informática son para mujeres, ¿por qué son tantos los números en la comunidad de código abierto? ¿más bajo?

Hay algunas posibilidades a considerar al pensar en una respuesta a esta pregunta:

1. Tal vez no haya una fuerte correlación entre el talento de programación y la actividad de GitHub.

En la industria de la tecnología, muchos desarrolladores acuden a GitHub al principio de sus carreras, ya que es un requisito previo para ser tomado en serio. Sin embargo, parece que menos aspirantes a programadoras ven el código abierto de esta manera. ¿Es posible que todos estos datos sean coincidencias y no signifiquen mucho en relación con la cantidad de ingenieras de software talentosas en la industria tecnológica?

Discutí la cuestión con dos ingenieros de Toptal, Anna-Chiara Bellini y Bozhidar Batsov. Anna-Chiara tiene más de 20 años de experiencia en ingeniería de software en una variedad de entornos académicos y comerciales, y Bozhidar ocupa el puesto 98 en la lista de los contribuyentes de GitHub más activos del mundo.

Ambos coincidieron en que, si bien estar activo en GitHub suele ser un buen indicador de la experiencia en ingeniería, lo contrario no es cierto, y mencionaron que conocen a muchos ingenieros excelentes que no están involucrados en absoluto con el código abierto. La industria de la tecnología también está de acuerdo, ya que muchas empresas evalúan los perfiles de GitHub durante los procesos de contratación (aunque esta práctica parece estar bastante sesgada, lo que no es realmente una sorpresa dados los resultados de mi estudio).

La actividad de GitHub es generalmente un buen indicador de la experiencia en ingeniería, pero lo contrario no es cierto... Muchos grandes ingenieros no están en GitHub.
Pío

Bozhidar sugirió que los contribuyentes de código abierto a menudo son más propensos a ser el tipo de personas que impulsan grandes cambios internos en el entorno de una empresa. Anna-Chiara comentó que se necesita mucha confianza para contribuir al código abierto, algo que pensó que podría ser más difícil de superar para las mujeres desarrolladoras, dada la mala historia de la industria tecnológica con la bienvenida a las mujeres.

Sin duda, hay varios sesgos que podrían estar en juego con estos datos de GitHub (incluido el hecho de que casi el 25 % de los nombres no se pueden clasificar como masculino/femenino con confianza).

Sin embargo, Bozhidar, Anna-Chiara y yo estuvimos de acuerdo en que el nivel de actividad de GitHub es generalmente un buen indicador de la experiencia en programación. Sin embargo, estos datos sugieren una tendencia de programadoras talentosas que eligen interrumpir (o nunca comenzar) sus actividades de código abierto en favor de otras opciones.

2. Los números citados en los informes de las empresas de tecnología incluyen roles no tecnológicos.

Muchas empresas de la industria tecnológica afirman que emplean entre un 25 y un 30 % de mujeres. Este número, sin embargo, puede ser engañoso. La mayoría de estos números más grandes, sí, son los más grandes, incluyen roles técnicos y no técnicos.

A medida que comienza a examinar el porcentaje de empleadas en puestos técnicos, las cifras descienden aún más.

En Facebook, el 32 % de los empleados son mujeres, pero solo el 16 % de los puestos técnicos pertenecen a mujeres. En Google, hay una caída similar del 30 por ciento de las empleadas en la empresa en su conjunto al 18 por ciento en puestos técnicos. Slack cae del 39 % de mujeres en general al 18 % en puestos de ingeniería. De las empresas que he examinado, Intel tiene el salto más pequeño, pasando del 24,1 % de mujeres en general al 19,4 % en puestos técnicos.

Entonces, aunque muchas empresas cuentan con un porcentaje de empleadas que es aproximadamente una cuarta parte o incluso un tercio de la empresa, la cantidad de mujeres en puestos técnicos es en realidad mucho menor. Parece que las afirmaciones del 15 al 20 por ciento serían más precisas.

Pero eso aún deja una gran disparidad entre el porcentaje de mujeres involucradas en roles técnicos o de ingeniería en empresas de tecnología y el porcentaje de mujeres que contribuyen a proyectos de código abierto en GitHub.

3. Las programadoras están abandonando la industria tecnológica.

Si la actividad en GitHub se correlaciona con la antigüedad y la experiencia, entonces el número extremadamente bajo de colaboradoras activas (bajo incluso en comparación con las colaboradoras en general) podría explicarse por la tasa alarmantemente alta de abandono de ingenieras de la industria tecnológica.

Entre las mujeres que se unen a la industria de la tecnología, el 56 % lo deja a mitad de carrera, lo que representa el doble de la tasa de deserción de los hombres.
Pío

Si la industria de la tecnología no puede retener a tantas mujeres más allá de la mitad de su carrera, es probable que tampoco contribuyan a muchos proyectos de código abierto.

Pero esta línea de razonamiento también plantea la pregunta: ¿Es realmente cierta la correlación entre la antigüedad y la contribución? Muchos contribuyentes frecuentes de OSS son programadores relativamente nuevos que están tratando de establecer un nombre para sí mismos, entonces, ¿dónde están las mujeres de ese grupo?

4. GitHub puede ser una comunidad poco acogedora para las programadoras.

Al comentar sobre un artículo sobre mujeres en tecnología, una desarrolladora dice: “En lo que respecta a los proyectos de código abierto, he estado pensando en esto recientemente. De hecho, no me he comprometido con ninguno y definitivamente pone un escollo en mi carrera... Siento que es un círculo en el que no puedo entrar. Pero sobre todo temo la atención excesiva de ser una única programadora en un proyecto disponible públicamente. A la luz de cómo se trata a las mujeres en Internet, este temor no parece irrazonable”.

Anna-Chiara cree que este tipo de aprensión es un tema común entre las mujeres ingenieras, especialmente cuando se trata de OSS. Cuando le pregunté si pensaba que era menos probable que las mujeres contribuyeran a proyectos de código abierto, respondió, sin dudarlo, que sí.

Anna-Chiara también mencionó la posibilidad de que las usuarias de GitHub intenten adoptar un nombre de género neutral o masculino para asegurarse de que se las tome en serio (recuerde que genderize.io no pudo determinar con confianza el género de aproximadamente una cuarta parte de las perfiles raspados).

Eso no significa, sin embargo, que las mujeres colaboradoras no estén disponibles. Bozidhar menciona Exercism.io, un proyecto popular iniciado por Katrina Owen que cuenta con varias colaboradoras. También menciona a Bodil Stokke, una desarrolladora de Noruega con una historia extremadamente extensa de contribuciones populares de código abierto.

Anna-Chiara también sugiere que si un proyecto tuviera mujeres entre los principales contribuyentes o líderes, es más probable que las desarrolladoras contribuyan a él. Desafortunadamente, en comparación con la cantidad de proyectos dominados por hombres, los proyectos de OSS dirigidos por mujeres son difíciles de encontrar.

Pero el problema va más allá del OSS. “Si pienso en las mujeres que conozco en desarrollo, no se acerca al 20% del que se habla en estas grandes empresas. No creo que esté ni siquiera cerca del 10%”, me dice Anna-Chiara. “El resultado de este análisis de GitHub no me sorprende”.

5. Los sesgos implícitos que dan forma a la industria tecnológica podrían estar llegando a GitHub.

Eric Ries señala problemas de sesgos implícitos en la industria tecnológica. Incluso si las personas individuales dentro de los sistemas no están sesgadas, es extremadamente fácil que esos sistemas se sesguen. Las personas también tienen sesgos inconscientes, lo que complica aún más el tema.

En su artículo, Eric usa el ejemplo de las orquestas, que eran principalmente de hombres hasta la década de 1970. La gente creía que los intérpretes masculinos tenían una aptitud superior para la música que las intérpretes femeninas. Sin embargo, una vez que las orquestas comenzaron a separar a los músicos de los jueces con una pantalla física durante las audiciones, los números cambiaron significativamente y la gente comenzó a aceptar que, en promedio, hombres y mujeres tocaban igual de bien.

Si entran en juego sesgos similares con los sistemas de contratación en la industria de la tecnología, podría ayudar a explicar el porcentaje más pequeño de ingenieras de software que mencioné anteriormente. Y si se contratan menos ingenieras de software, esos efectos podrían filtrarse a comunidades de código abierto como GitHub. Si alguien es rechazado para funciones de programación a tiempo completo, es posible que llegue a creer que no tiene tanto talento y, por lo tanto, es menos probable que tenga la confianza para contribuir a proyectos de código abierto.

¿Dónde nos deja esto?

Aquí hay algunas preguntas de seguimiento que me vienen a la mente (y hay muchas más):

1. ¿Cómo cambian estos números con el tiempo?

Involucrar a más mujeres en la industria de la tecnología es un tema muy discutido en este momento, y el aumento de los bootcamps de codificación que requieren contribuciones debería tener un impacto positivo, incluso cuando se trata de código abierto. ¿Qué tan efectivos son esos debates y las diversas iniciativas nuevas? ¿Cómo serían estos números hace 3 años? ¿Hace 5 años? ¿Qué tal en un año?

2. ¿De qué otra forma podemos analizar los datos de GitHub?

Anna-Chiara sugirió examinar el desglose por género de los usuarios según la cantidad de bifurcaciones que tienen para tener una idea de la frecuencia con la que las usuarias de GitHub experimentan con un proyecto de alguna manera. Además, hay otros factores en juego, como el grupo de edad, que podrían afectar nuestros hallazgos. El código abierto ha sido un elemento básico de la industria tecnológica durante mucho tiempo, pero GitHub se fundó recién en 2008.

3. ¿Existe una buena manera de ver qué usuarios de GitHub emplean un nombre falso?

Si el porcentaje de mujeres que usan un nombre falso es mucho más alto que el porcentaje de mujeres en GitHub en general, sería una declaración muy fuerte sobre cuán acogedor es GitHub (y la tecnología en general, hasta cierto punto) como comunidad.

4. ¿Cómo cambian estos números cuando empiezas a mirar la ubicación?

Esto es imperfecto, ya que la interacción en GitHub es teóricamente independiente de la ubicación. Pero, ¿podemos aprender algo de las comunidades tecnológicas en países que tienen una proporción de usuarias de GitHub superior a la media?

Y aquí hay algunas ideas para mejorar estos números (una vez más, hay muchas más, por supuesto):

1. ¿Se pueden mejorar las páginas de los repositorios populares de GitHub?

Cuando discutí este tema con Bozhidar, mencionó que la mayoría de los proyectos/comunidades en GitHub tienen líderes que son extremadamente pacientes, acogedores y felices de guiar a los nuevos contribuyentes de código abierto a través de las primeras etapas del proyecto. Esto no parece ser de conocimiento común en absoluto (recuerde el comentario mencionado anteriormente de una desarrolladora que sintió que las comunidades de código abierto eran "un círculo [en el que no podía] entrar").

¿Son conscientes los nuevos usuarios de GitHub de que existe este tipo de tutoría y apoyo (suponiendo que sea tan frecuente como él dice), y sabría un nuevo usuario cómo encontrar fácilmente dicha orientación? ¿Se podrían realizar mejoras en las interfaces de los repositorios populares de GitHub para que esto sea más obvio y más acogedor? Por ejemplo, si las páginas de repositorio populares incluyeran algo así como un rol oficial de "Mentor de repositorio", tal vez sería mucho más claro que un usuario experimentado y acogedor estuviera disponible para responder cualquier pregunta.

2. Publicar mejores (y más frecuentes) guías de "Introducción a GitHub".

Hay muchas publicaciones que te enseñan cómo usar GitHub guiándote a través de extracciones/empujes, confirmaciones, bifurcaciones y más, pero no encuentro casi nada en términos de pautas para interactuar dentro de la comunidad de GitHub (si conoces cualquiera, publique enlaces relevantes en los comentarios).

Una guía práctica para navegar por la etiqueta de la comunidad de GitHub y las mejores prácticas de acuerdo con su nivel de habilidad podría ayudar a romper la intimidación y destacar los elementos de contribuir al código abierto. Esto definitivamente es algo que podría alentar a más aspirantes a nuevos desarrolladores a involucrarse. Estén atentos a una guía como esta de Toptal.

3. Más tutoría podría hacer una enorme diferencia.

Bozhidar comentó sobre la importancia de los desarrolladores involucrados en el proyecto que estaban dispuestos a ayudar a los recién llegados a comenzar con las tareas básicas, mientras que Anna-Chiara discutió cómo podría ser bastante intimidante lanzarse a un proyecto y exponer su trabajo a las críticas. Parece que se podría hacer mucho para que las comunidades de código abierto sean más acogedoras para todos, incluidas las mujeres. ¡Estén atentos a una iniciativa de Toptal aquí también!

¿Estás sorprendido por los resultados de GitHub? ¿Qué crees que significan?