오픈 소스는 여성에게 열려 있습니까?
게시 됨: 2022-03-11다음은 여성 개발자를 위한 탑탈 장학금 런칭에 앞서 게시된 내용입니다. 장학금 신청자를 지원하기 위해 Toptal은 첫 번째 오픈 소스 기여 가이드도 발행했습니다.
여성은 기술 분야에서 과소 대표됩니다. 이러한 깨달음은 새로운 것이 아닙니다. Facebook, Google, Intel, Slack 등에서 발표한 수치만 보세요. 그러나 수치는 이러한 보고서가 암시하는 것보다 훨씬 더 나쁠 수 있습니다.
최근 기술 행사에서 기술 분야의 성별 다양성 부족에 대한 부수적인 대화를 우연히 들었습니다. 소규모 그룹은 여성이 기술 인력의 약 30%를 차지하지만 상위 수준의 엔지니어링 팀에는 여성이 몇 명 이상 있는 경우가 거의 없다는 사실에 대해 논의하고 있었습니다.
이 대화의 참가자 중 한 명은 남성 개발자가 일반적으로 여성 개발자보다 더 재능이 있기 때문이라고 말했습니다. 그룹의 누구도 반대하지 않았습니다.
흠…
Toptal에서의 개인적인 경험과 Princeton에서의 엔지니어링 경험(남성 대 여성의 비율이 거의 50/50)에서 나는 이것이 거짓이라는 것을 압니다. 저는 모든 종류의 역할에서 놀랍고 매우 똑똑한 많은 여성 엔지니어들과 함께 일해 왔습니다. 그러나 수치는 내 경험과 일치하지 않는 것 같습니다. 특히 고위 엔지니어링 역할을 보기 시작할 때 더욱 그렇습니다.
그리고 이러한 격차를 해소하는 것이 중요합니다. 다양성을 위한 다양성만이 아닙니다. 통계적으로 말해서 남성과 여성의 지능이 같다면 세계에서 가장 똑똑한 10명 중 5명은 남성이고 5명은 여성이어야 합니다. 따라서 귀하의 팀이 남녀의 동등한 균형보다 낮다면 귀하의 팀은 아마도 최고가 아닐 것입니다.
완벽한 시스템에서 다양성은 확률적 결과입니다. 그러나 이것은 우리가 보고 있는 결과가 아닙니다.
이 대화를 엿들은 후 저는 소프트웨어 팀 구축 경향이 잘못되고 있는지/어디에서 잘못되고 있는지 더 잘 이해하기 위해 숫자를 살펴보고 싶었습니다. 소프트웨어 엔지니어링의 기술 수준에 따른 성별 분석 동향에 대해 Google을 검색했지만 많이 찾을 수 없었으므로 GitHub에서 공개적으로 사용할 수 있는 데이터를 보기로 결정했습니다. 이름, 팔로워 수, 기여 수, 저장소 수를 얻기 위해 5,000개의 프로필을 스크랩했습니다. 그런 다음 오픈 소스 패키지인 genderize.io를 사용하여 각 프로필의 성별을 파악했습니다.
이 첫 번째 배치에는 여성이 너무 적었기 때문에 간단한 그래프라도 의미 있게 만들기 위해 더 많은 데이터를 추가해야 했기 때문에 15,000명을 더 긁었습니다.
내가 찾은 것은 다음과 같습니다.
오픈 소스는 남성이 지배합니다
더 자세한 분석을 하기 전에도 여성의 비율이 극도로 낮다는 것이 분명했습니다. 20,000개의 프로필 중 genderize.io는 15,374명의 성별을 자신 있게 결정할 수 있었습니다. 그 중 여성은 6.0%(926명)에 불과했다. 사용자 활동을 살펴보기 시작하면 격차가 더 심해집니다.
프로필을 생성하고 약간의 실험을 한 사용자와 오픈 소스 프로젝트에 대해 탐구했거나 자체적으로 시작한 사용자 간의 차이를 기준으로 10개의 기여를 고려하겠습니다. 결과: 5.4% 여성.
실제로 사용자를 기여 수에 따라 버킷으로 나누면(각 버킷에 최소 1,000명의 사용자가 있음) 기여가 증가함에 따라 여성 사용자의 비율이 감소하는 경향이 있습니다.
기술 산업의 성별 다양성 수치가 시사하는 것보다 GitHub에 여성이 훨씬 적을 뿐만 아니라 사용자 활동이 증가함에 따라 여성의 비율이 감소하는 것처럼 보입니다.
팔로어 수와 리포지토리 수에 따라 성별을 계속 파고 들었고 동일한 추세를 관찰했습니다. 이것은 리포지토리의 수를 볼 때 특히 분명했습니다.
다시 말하지만, 더 많은 리포지토리가 있는 버킷으로 이동함에 따라 여성의 비율이 감소하는 것을 볼 수 있습니다.
여기에서 무슨 일이 일어나고 있습니까? GitHub 활동은 애초에 프로그래밍 전문성을 나타내는 합리적인 지표입니까? (그렇다고 생각합니다.) 재능 있는 여성 엔지니어는 남성 엔지니어보다 오픈 소스에 적극적으로 기여할 가능성이 낮습니까? 이러한 결과는 여성 엔지니어와 관련하여 기술 산업의 진입/유지 문제를 나타내는 또 다른 지표입니까?
오픈 소스 커뮤니티의 숫자가 낮은 이유는 무엇입니까?
기술 산업에 종사하는 여성의 숫자는 이미 상당히 암울하지만 오픈 소스 프로젝트에서는 더 심각합니다.
이전의 많은 연구는 여성이 STEM 관련 주제 및 직업에 기꺼이 착수하지 않는 이유에 초점을 맞췄습니다. 일부는 STEM 주제에 대한 일반적인 관심 부족을 결론지었습니다. 다른 이들은 여성이 가족과 교사로부터 고정관념을 받은 후 STEM 경력을 추구하지 않기로 결정했다고 믿습니다. 또 다른 사람들은 역할 모델의 부족 또는 여러 원인의 조합을 인용합니다.
StackOverflow의 젠더에 관한 연구에 따르면, “성 문제와 STEM 관련 주제는 수년간 연구되어 왔으며 대부분 여성이 과학 연구나 직업에 참여하지 않는 '왜'의 관점에서 연구되었습니다. 지금까지 온라인 커뮤니티에서 여성의 현상과 대표성(기술-'사용자'), 참여 수준, 성별 수준에서 차이를 감지할 수 있는지 여부를 정량화하는 데 덜 관심을 기울였습니다. 특정 커뮤니티가 여성의 참여를 적극적으로 막는 방법에 대한 일화적인 증거만 수집되었습니다.”
그러나 STEM 관련 과목을 추구하는 여성이 적은 이유에 집중하는 데 너무 많은 시간을 할애하면 또 다른 중요한 격차에 초점을 잃습니다. CS 석사 학위의 28%가 여성에게 간다면 오픈 소스 커뮤니티의 숫자는 왜 그렇게 많은가요? 낮추다?
이 질문에 대한 답을 생각할 때 고려해야 할 몇 가지 가능성이 있습니다.
1. 프로그래밍 재능과 GitHub 활동 사이에 강한 상관관계가 없을 수도 있습니다.
기술 산업에서 많은 개발자는 진지하게 받아 들여야 하는 전제 조건이기 때문에 경력 초기에 GitHub로 이동합니다. 그러나 오픈소스를 이런 식으로 바라보는 여성 개발자는 적은 것 같다. 이 데이터가 모두 우연의 일치이며 기술 산업의 재능 있는 여성 소프트웨어 엔지니어의 수와 관련하여 큰 의미가 없을 수 있습니까?
나는 Toptal의 Anna-Chiara Bellini 및 Bozhidar Batsov의 두 엔지니어와 이 질문에 대해 논의했습니다. Anna-Chiara는 다양한 학술 및 비즈니스 환경에서 20년 이상의 소프트웨어 엔지니어링 경험을 가지고 있으며 Bozhidar는 세계에서 가장 활동적인 GitHub 기고자 목록에서 98위입니다.
둘 다 GitHub에서 활동하는 것이 일반적으로 엔지니어링 전문 지식의 좋은 지표라는 데 동의했지만 오픈 소스에 전혀 관여하지 않은 훌륭한 엔지니어를 많이 알고 있다고 언급하면서 그 반대는 사실이 아닙니다. 기술 업계도 동의합니다. 많은 회사가 고용 과정에서 GitHub 프로필을 평가합니다(비록 이 관행은 상당히 편향된 것으로 보이지만, 이는 제 연구 결과를 고려할 때 놀라운 일이 아닙니다).
Bozhidar는 오픈 소스 기여자가 회사 환경에서 큰 내부 변화를 추진하는 유형의 사람들일 가능성이 더 높다고 제안했습니다. Anna-Chiara는 오픈 소스에 기여하는 데 상당한 자신감이 필요하다고 언급했습니다. 이는 기술 산업이 여성을 환영하는 열악한 역사를 고려할 때 여성 개발자가 극복하기 더 어려울 수 있다고 생각한 부분입니다.
이 GitHub 데이터에 잠재적으로 작용할 수 있는 몇 가지 편견이 분명히 있습니다(이름의 거의 25%가 자신 있게 남성/여성으로 분류할 수 없다는 사실 포함).
그러나 Bozhidar, Anna-Chiara 및 저는 GitHub 활동 수준이 일반적으로 프로그래밍 전문성을 나타내는 좋은 지표라는 데 동의했습니다. 그러나 이 데이터는 재능 있는 여성 프로그래머가 다른 옵션을 선호하여 오픈 소스 추구를 중단(또는 시작하지 않음)하는 경향을 나타냅니다.
2. 기술 회사 보고서에 인용된 숫자에는 비기술적 역할이 포함됩니다.
기술 산업의 많은 회사들은 25~30%의 여성을 고용하고 있다고 말합니다. 그러나 이 수치는 오해의 소지가 있습니다. 이러한 큰 숫자의 대부분(예, 더 큰 숫자)에는 기술적 역할과 비기술적 역할이 모두 포함됩니다.

기술 역할에 있는 여성 직원의 비율을 조사하기 시작하면 그 숫자는 훨씬 더 낮아집니다.
Facebook에서 직원의 32%가 여성이지만 기술 역할의 16%만이 여성입니다. Google의 경우 회사 전체의 여성 직원 중 30%가 기술 역할에서 18%로 비슷한 수준으로 떨어졌습니다. Slack은 전체 여성 39%에서 엔지니어링 역할 18%로 떨어집니다. 내가 조사한 회사 중 Intel은 전체 여성의 24.1%에서 기술 역할의 19.4%로 가장 작은 상승률을 보였습니다.
따라서 많은 회사가 회사의 약 4분의 1 또는 심지어 3분의 1에 해당하는 여성 직원의 비율을 자랑하지만 기술 역할에 있는 여성의 수는 실제로 훨씬 적습니다. 15~20%의 주장이 더 정확할 것 같습니다.
그러나 기술 회사에서 기술 또는 엔지니어링 역할에 관련된 여성의 비율과 GitHub의 오픈 소스 프로젝트에 기여하는 여성의 비율 사이에는 여전히 큰 격차가 있습니다.
3. 여성 프로그래머들이 기술 산업을 떠나고 있다.
GitHub의 활동이 연공서열 및 전문 지식과 상관관계가 있는 경우 활성 여성 기고자의 극도로 적은 수(전체 여성 기고자에 비해 낮음)는 기술 산업에서 여성 엔지니어의 이탈률이 놀라울 정도로 높기 때문에 설명할 수 있습니다.
기술 산업이 중년 이상의 여성을 유지할 수 없다면 많은 오픈 소스 프로젝트에도 기여하지 못할 가능성이 큽니다.
그러나 이러한 추론 방식은 또한 다음과 같은 질문을 던집니다. 연공서열과 기여도 간의 상관 관계가 실제로 사실입니까? OSS에 자주 기여하는 많은 사람들은 상대적으로 새로운 프로그래머로서 자신의 이름을 알리려고 합니다. 그렇다면 해당 그룹의 여성은 어디에 있습니까?
4. GitHub는 여성 프로그래머에게 환영받지 못하는 커뮤니티가 될 수 있습니다.
기술 분야의 여성에 대한 기사에 대해 한 여성 개발자는 다음과 같이 말했습니다. 나는 실제로 어떤 것에 전념하지 않았고 그것은 확실히 내 경력에 꼬임을 줍니다... 내가 들어갈 수 없는 서클 같은 느낌이 듭니다. 그러나 나는 대부분 공개적으로 사용 가능한 프로젝트에서 유일한 여성 프로그래머가 되는 것이 과도한 스포트라이트를 받는 것을 두려워합니다. 인터넷에서 여성들을 대하는 방식에 비추어 볼 때 이러한 두려움이 부당해 보이지는 않는다”고 말했다.
Anna-Chiara는 특히 OSS와 관련하여 여성 엔지니어들 사이에서 이러한 종류의 우려가 일반적인 주제라고 생각합니다. 내가 그녀에게 여성이 오픈 소스 프로젝트에 기여할 가능성이 낮다고 생각하느냐고 물었을 때 그녀는 주저 없이 그렇다고 대답했습니다.
Anna-Chiara는 또한 여성 GitHub 사용자가 진지하게 받아들여지도록 하기 위해 성 중립적이거나 남성적인 이름을 채택하려고 할 수 있다는 가능성을 제기했습니다(genderize.io는 프로필 스크랩).
그러나 그렇다고 해서 여성 기고자가 존재하지 않는 것은 아닙니다. Bozidhar는 Katrina Owen이 시작한 인기 있는 프로젝트인 Exercism.io를 불러왔습니다. 이 프로젝트에는 여러 여성 기여자가 있습니다. 그는 또한 인기 있는 오픈 소스 기여의 매우 광범위한 이력을 가진 노르웨이의 여성 개발자인 Bodil Stokke에 대해 언급합니다.
Anna-Chiara는 또한 프로젝트에 최고 기여자 또는 리더 중 여성이 있는 경우 여성 개발자가 프로젝트에 기여할 가능성이 더 높다고 제안합니다. 불행히도 남성이 주도하는 프로젝트의 수에 비해 여성이 주도하는 OSS 프로젝트는 찾기가 어렵습니다.
그러나 문제는 OSS보다 더 큽니다. “내가 아는 개발 분야의 여성을 생각해보면 이 대기업에서 듣게 되는 20%에 가깝지 않습니다. 나는 그것이 10%에 가깝다고 생각하지 않습니다.”라고 Anna-Chiara가 말했습니다. "이 GitHub 분석 결과는 놀랍지 않습니다."
5. 기술 산업을 형성하는 암묵적인 편견이 GitHub로 흘러들어갈 수 있습니다.
Eric Ries는 기술 산업에 내재된 편견의 문제를 지적합니다. 시스템 내의 개별 사람들이 편향되지 않더라도 그러한 시스템이 편향되기는 여전히 매우 쉽습니다. 사람들은 또한 무의식적인 편견을 가지고 있는데, 이는 문제를 더욱 복잡하게 만듭니다.
그의 기사에서 Eric은 1970년대까지 주로 남성으로만 구성된 오케스트라의 예를 사용했습니다. 사람들은 남성 연주자가 여성 연주자보다 음악에 뛰어난 소질이 있다고 믿었습니다. 그러나 오케스트라가 오디션 중 물리적인 스크린으로 음악가와 심사위원을 분리하기 시작하자 숫자가 크게 바뀌었고 사람들은 남성과 여성이 평균적으로 동등하게 연주한다는 것을 받아들이기 시작했습니다.
기술 산업의 고용 시스템에서 유사한 편견이 작용한다면 앞서 논의한 여성 소프트웨어 엔지니어의 비율이 더 낮은 이유를 설명하는 데 도움이 될 수 있습니다. 그리고 여성 소프트웨어 엔지니어가 더 적게 고용된다면 그 효과는 GitHub와 같은 오픈 소스 커뮤니티로 흘러들어갈 수 있습니다. 누군가가 정규 프로그래밍 역할에 대해 거부되면 자신이 재능이 없다고 믿게 되므로 오픈 소스 프로젝트에 기여할 자신감이 줄어들 것입니다.
이것이 우리를 어디로 떠나게 합니까?
다음은 마음에 떠오르는 몇 가지 후속 질문입니다(그리고 더 많이 있습니다).
1. 이 숫자는 시간이 지남에 따라 어떻게 변하고 있습니까?
기술 산업에 더 많은 여성을 참여시키는 것은 현재 매우 논의되는 주제이며 기여를 요구하는 코딩 부트캠프의 부상은 오픈 소스와 관련하여 긍정적인 영향을 미칠 것입니다. 그러한 논의와 다양한 새로운 이니셔티브가 얼마나 효과적인가? 3년 전 이 숫자는 어떻게 생겼을까요? 5 년전? 1년 뒤에는?
2. GitHub 데이터를 다른 방법으로 분석할 수 있습니까?
Anna-Chiara는 여성 GitHub 사용자가 어떤 식으로든 프로젝트를 실험하는 빈도에 대한 아이디어를 얻기 위해 포크 수를 기반으로 사용자의 성별 분석을 조사할 것을 제안했습니다. 또한, 우리의 연구 결과에 영향을 미칠 수 있는 연령 그룹과 같은 다른 요인이 있습니다. 오픈 소스는 오랫동안 기술 산업의 필수품이었지만 GitHub는 2008년에 설립되었습니다.
3. 어떤 GitHub 사용자가 가짜 이름을 사용하고 있는지 확인할 수 있는 좋은 방법이 있습니까?
가짜 이름을 사용하는 여성의 비율이 GitHub 전체의 여성 비율보다 훨씬 높으면 GitHub(및 일반적으로 기술)이 커뮤니티로서 얼마나 환영하는지에 대해 매우 강력한 진술이 될 것입니다.
4. 위치를 보기 시작하면 이 숫자가 어떻게 바뀌나요?
GitHub의 상호 작용은 이론적으로 위치에 구애받지 않기 때문에 이것은 불완전합니다. 그러나 여성 GitHub 사용자의 비율이 평균보다 높은 국가의 기술 커뮤니티에서 무엇을 배울 수 있습니까?
다음은 이러한 수치를 개선하기 위한 몇 가지 아이디어입니다(물론 더 많이 있습니다).
1. 인기 있는 GitHub 리포지토리의 페이지를 개선할 수 있습니까?
내가 이 주제를 Bozhidar와 논의했을 때 그는 GitHub의 대부분의 프로젝트/커뮤니티에 매우 인내심 있고 환영하며 프로젝트의 초기 단계를 통해 새로운 오픈 소스 기여자를 기꺼이 안내하는 리더가 있다고 언급했습니다. 이것은 전혀 일반적인 지식이 아닌 것 같습니다(오픈 소스 커뮤니티가 "[그녀는] 들어갈 수 없는] 서클"이라고 느꼈던 앞서 언급한 여성 개발자의 말을 기억하십시오.
새로운 GitHub 사용자는 이러한 유형의 멘토링 및 지원이 존재한다는 것을 알고 있으며(그가 말한 것처럼 널리 퍼져 있다고 가정), 새로운 사용자가 그러한 지침을 쉽게 찾는 방법을 알고 있습니까? 인기 있는 GitHub 리포지토리의 인터페이스를 개선하여 이것을 더 명확하게 만들고 더 친근하게 만들 수 있습니까? 예를 들어 인기 있는 리포지토리 페이지에 공식 "리포지토리 멘토" 역할과 같은 것이 포함되어 있는 경우 환영하고 경험이 많은 사용자가 질문에 답변할 수 있다는 것이 훨씬 더 명확했을 것입니다.
2. 더 나은(그리고 더 널리 퍼진) "GitHub 시작하기" 가이드를 게시합니다.
pull/push, 커밋, 분기 등을 안내하여 GitHub를 사용하는 방법을 가르치는 많은 게시물이 있지만 GitHub 커뮤니티 내에서 상호 작용하기 위한 지침 측면에서 볼 때는 거의 없습니다. 무엇이든, 의견에 관련 링크를 게시하십시오).
기술 수준에 따라 GitHub 커뮤니티 에티켓 및 모범 사례를 탐색하는 방법 가이드는 오픈 소스에 기여하는 위협 요소와 주목 요소를 분해하는 데 도움이 될 수 있습니다. 이것은 확실히 더 많은 야심 찬 개발자가 참여하도록 장려할 수 있는 것입니다. Toptal에서 이와 같은 가이드를 계속 지켜봐 주십시오.
3. 더 많은 멘토링이 엄청난 차이를 만들 수 있습니다.
Bozhidar는 신규 이민자가 기본 작업을 시작할 수 있도록 기꺼이 도울 수 있는 프로젝트 관련 개발자의 중요성에 대해 언급했으며 Anna-Chiara는 프로젝트에 뛰어들어 작업을 비판에 노출시키는 것이 얼마나 겁이 날 수 있는지에 대해 설명했습니다. 오픈 소스 커뮤니티가 여성을 포함한 모든 사람을 더 환영하게 만들기 위해 할 수 있는 일이 많이 있는 것 같습니다. 여기에서 Toptal의 이니셔티브도 계속 지켜봐 주세요!
GitHub의 결과에 놀랐습니까? 그들이 무엇을 의미한다고 생각합니까?