オープンソースは女性に開かれていますか?
公開: 2022-03-11以下は、女性開発者のためのToptalScholarshipsの開始に先立って投稿されました。 奨学金申請者をサポートするために、Toptalは最初のオープンソース貢献を行うためのガイドも公開しています。
女性はハイテク業界では過小評価されています。 この認識は新しいものではありません。 Facebook、Google、Intel、Slack、その他多数のリリースされた数字を見てください。 しかし、数字はこれらのレポートが示唆するよりもさらに悪いかもしれません。
最近の技術イベントで、私は技術における性別の多様性の欠如についての副次的な会話を耳にしました。 小グループは、女性が技術系の労働力の約30%を占めているにもかかわらず、高レベルのエンジニアリングチームに女性が数人以上いることはめったにないという事実について話し合っていました。
この会話の参加者の1人は、これは男性の開発者が女性の開発者よりも一般的に才能があるためだとコメントしました。 グループの誰も反対しませんでした。
うーん…
Toptalでの個人的な経験と、プリンストンでの工学の大学での経験(男性対女性のほぼ50/50)から、これは誤りであることがわかります。 私は、あらゆる種類の役割で、多くの信じられないほど賢い女性エンジニアと仕事をしてきました。 それでも、特にあなたがより上級のエンジニアリングの役割を見始めたとき、その数は私自身の経験と一致していないようです。
そして、この格差に対処することが重要です。 多様性のための多様性だけではありません。 統計的に言えば、男性と女性が同じように頭が良い場合、世界で最も賢い10人のうち、5人が男性で、5人が女性である必要があります。 したがって、あなたのチームが男性と女性のバランスが等しくない場合、あなたのチームはおそらく最高のものではありません。
完璧なシステムでは、多様性は確率的な結果です。 しかし、これらは私たちが見ている結果ではありません。
この会話を聞いた後、ソフトウェアチームビルディングの傾向がうまくいかなかったかどうか/どこでうまくいかなかったかをよりよく理解するために数字を見てみたいと思いました。 ソフトウェアエンジニアリングのスキルレベル全体での性別の内訳の傾向をGoogleで検索しましたが、あまり見つけることができなかったため、GitHubで公開されているデータを確認することにしました。 5,000のプロファイルをスクレイプして、名前、フォロワー数、投稿数、リポジトリ数を取得しました。 次に、オープンソースパッケージgenderize.ioを使用して、各プロファイルの性別を把握しました。
この最初のバッチには女性が少なかったため、単純なグラフでも重要なものにするためにデータを追加する必要があったため、さらに15,000を削りました。
これが私が見つけたものです:
オープンソースは男性によって支配されています
さらに分析を始める前でさえ、女性の割合が非常に低いことは明らかでした。 20,000のプロファイルのうち、genderize.ioは15,374の性別を自信を持って判断できました。 そのうち、女性はわずか6.0%(926人)でした。 ユーザーのアクティビティを確認し始めると、格差はさらに深刻になります。
プロファイルを作成したばかりで少し実験したばかりのユーザーと、少なくともオープンソースプロジェクトを掘り下げたユーザーまたは独自のプロジェクトを開始したユーザーとの違いのカットオフとして、10の貢献を取り上げましょう。 結果:5.4%の女性。
実際、投稿数に応じてユーザーをバケットに分割すると(各バケットに最低1,000ユーザー)、投稿が増えるにつれて女性ユーザーの割合が減少する傾向があります。
GitHubには、テクノロジー業界の性別の多様性の数値が示唆するよりもはるかに少ない女性がいるだけでなく、ユーザーのアクティビティが増えるにつれて女性の割合が減少しているように見えます。
フォロワー数やリポジトリ数で性別を調べながら掘り下げていき、同じ傾向を観察しました。 これは、リポジトリの数を見ると特に明確でした。
繰り返しになりますが、リポジトリの数が多いバケットに移動すると、女性の割合が減少することがわかります。
では、ここで何が起こっているのでしょうか。 GitHubのアクティビティは、そもそもプログラミングの専門知識の合理的な指標ですか? (そうだと思います。)才能のある女性エンジニアは、男性エンジニアよりもオープンソースに積極的に貢献する可能性が低いのでしょうか。 これらの結果は、女性エンジニアに関して、テクノロジー業界の参入/保持の問題を示すもう1つの指標ですか?
オープンソースコミュニティの数が非常に少ないのはなぜですか?
テクノロジー業界の女性の数はすでにかなり暗いですが、オープンソースプロジェクトではさらに悪化しています。
これまでの多くの研究は、女性がSTEM関連の科目やキャリアに乗り出すことをいとわない理由に焦点を当ててきました。 STEM科目に対する一般的な関心の欠如を結論付ける人もいます。 他の人は、女性が家族や教師によって固定観念にとらわれた後、STEMのキャリアを追求することに反対することを決定すると信じています。 さらに、ロールモデルの欠如または複数の原因の組み合わせを引用する人もいます。
StackOverflowのジェンダーに関する調査によると、「ジェンダーとSTEM関連の主題の問題は数年前から研究されており、主に「なぜ」女性が科学的研究やキャリアに従事しないという観点からです。 これまでのところ、オンラインコミュニティでの女性の現象と表現(テクノロジー-「ユーザー」として)、女性の参加レベル、性別レベルでの違いを検出できるかどうかを定量化することにはあまり注意が払われていません。 特定のコミュニティが女性の参加を積極的に思いとどまらせる方法については、事例証拠のみが収集されています。」
しかし、STEM関連の科目を追求する女性が少ない理由に焦点を当てるのに多くの時間を費やすと、別の重要な格差に焦点を当てることができなくなります。低い?
この質問への回答を考えるときに考慮すべきいくつかの可能性があります。
1.プログラミングの才能とGitHubのアクティビティの間に強い相関関係はないかもしれません。
テクノロジー業界では、多くの開発者がキャリアの早い段階でGitHubにアクセスします。これは、GitHubが真剣に受け止められるための前提条件だからです。 しかし、オープンソースをこのように見ている意欲的な女性開発者は少ないようです。 このデータがすべて偶然であり、テクノロジー業界の才能のある女性ソフトウェアエンジニアの数との関係であまり意味がない可能性はありますか?
Toptalの2人のエンジニア、Anna-ChiaraBelliniとBozhidarBatsovと質問について話し合いました。 Anna-Chiaraは、さまざまな学術およびビジネス環境で20年以上のソフトウェアエンジニアリングの経験があり、Bozhidarは世界で最もアクティブなGitHub貢献者のリストで98位です。
両者は、GitHubでアクティブになっていることは通常、エンジニアリングの専門知識の良い指標であるが、その逆は真実ではなく、オープンソースにまったく関与していない優れたエンジニアをたくさん知っていることに同意しました。 テクノロジー業界も同意しており、多くの企業が採用プロセス中にGitHubプロファイルを評価しています(ただし、この慣行はかなり偏っているように見えますが、私の調査結果を考えると、これは実際には驚きではありません)。
Bozhidarは、オープンソースの貢献者は、企業環境で大きな内部変化を推進するタイプの人々である可能性が高いと示唆しました。 Anna-Chiara氏は、オープンソースに貢献するには大きな自信が必要だとコメントしました。これは、テクノロジー業界の女性を歓迎する歴史が貧弱であることを考えると、女性開発者にとって克服するのは難しいかもしれないと彼女は考えました。
このGitHubデータに影響を与える可能性のあるバイアスは確かにいくつかあります(名前のほぼ25%が自信を持って男性/女性として分類できなかったという事実を含む)。
ただし、Bozhidar、Anna-Chiara、および私は、GitHubのアクティビティレベルが一般的にプログラミングの専門知識の優れた指標であることに同意しました。 しかし、このデータは、才能のある女性プログラマーが他のオプションを支持してオープンソースの追求を中止する(または決して開始しない)ことを選択する傾向を示唆しています。
2.テクノロジー企業のレポートに引用されている数字には、テクノロジー以外の役割が含まれています。
テクノロジー業界の多くの企業は、25〜30パーセントの女性を雇用していると述べています。 ただし、この数は誤解を招く可能性があります。 これらの大きな数字のほとんど(はい、それらは大きな数字です)には、技術的役割と非技術的役割の両方が含まれています。

技術職に就いている女性従業員の割合を調べ始めると、その数はさらに少なくなります。
Facebookでは、従業員の32%が女性ですが、技術的な役割の16%だけが女性に属しています。 グーグルでは、会社全体で30%の女性従業員が、技術的な役割で18%に同様に減少しています。 たるみは、女性全体の39%からエンジニアリング職の18%に低下します。 私が調査した企業の中で、インテルのジャンプは最小で、女性全体の24.1%から技術職の19.4%になっています。
そのため、多くの企業が女性従業員の割合を会社の約4分の1、さらには3分の1と自慢していますが、技術的な役割を担う女性の数は実際にははるかに少なくなっています。 15〜20パーセントの主張がより正確であるように思われます。
しかし、それでも、テクノロジー企業で技術的またはエンジニアリングの役割に関与している女性の割合と、GitHubのオープンソースプロジェクトに貢献している女性の割合との間には大きな格差があります。
3.女性プログラマーはテクノロジー業界を去っています。
GitHubでの活動が年功序列と専門知識と相関している場合、アクティブな女性貢献者の数が非常に少ない(全体として女性貢献者と比較しても少ない)ことは、テクノロジー業界からの女性エンジニアの驚くほど高い離職率によって説明できます。
テクノロジー業界が中途採用を超えて多くの女性を維持できない場合、彼らも多くのオープンソースプロジェクトに貢献しない可能性があります。
しかし、この一連の推論はまた、疑問を投げかけます:年功序列と貢献の間の相関関係は実際に本当ですか? 多くの頻繁なOSS寄稿者は、自分たちの名前を確立しようとしている比較的新しいプログラマーです。では、そのグループの女性はどこにいるのでしょうか。
4. GitHubは、女性プログラマーにとって歓迎されないコミュニティになる可能性があります。
ある女性開発者は、テクノロジー業界の女性に関する記事について次のように述べています。「オープンソースプロジェクトに関しては、最近これについて考えています。 私は実際には何も約束していません、そしてそれは間違いなく私のキャリアにねじれをもたらします…それは私が入ることができないサークルのように感じます。 しかし、ほとんどの場合、公に利用可能なプロジェクトで唯一の女性プログラマーであるという過度のスポットライトを恐れています。 インターネット上で女性がどのように扱われているかを考えると、この恐れは不合理に思えません。」
Anna-Chiaraは、この種の不安は、特にOSSに関しては、女性エンジニアの間で共通のテーマであると考えています。 私が彼女に女性がオープンソースプロジェクトに貢献する可能性が低いと思うかどうか尋ねたところ、彼女はためらうことなく答えました。
Anna-Chiaraはまた、女性のGitHubユーザーが、真剣に受け止められるように、性別に依存しない名前または男性の名前を採用しようとする可能性を提起しました(genderize.ioは、約4分の1の性別を自信を持って判断できなかったことを思い出してください。プロファイルが削られました)。
しかし、それは女性の貢献者がそこにいないという意味ではありません。 Bozidharは、Exercism.ioを立ち上げました。これは、カトリーナオーウェンが始めた人気のプロジェクトで、女性の貢献者が何人かいます。 彼はまた、人気のあるオープンソースの貢献の非常に広範な歴史を持つノルウェーの女性開発者であるBodilStokkeについても言及しています。
Anna-Chiaraはまた、プロジェクトのトップの貢献者またはリーダーの中に女性がいる場合、女性の開発者がプロジェクトに貢献する可能性が高いと示唆しています。 残念ながら、男性中心のプロジェクトの数と比較すると、女性主導のOSSプロジェクトを見つけるのは困難です。
しかし、問題はOSSだけではありません。 「私が開発中の女性について考えると、これらの大企業で耳にする20%にはほど遠いです。 10%に近いところはないと思います」とAnna-Chiaraは私に言います。 「GitHubのこの分析の結果は私を驚かせません。」
5.テクノロジー業界を形作る暗黙のバイアスがGitHubに流れ込んでいる可能性があります。
エリックリースは、テクノロジー業界における暗黙のバイアスの問題を指摘しています。 システム内の個々の人が偏っていなくても、それらのシステムが偏っているのは非常に簡単です。 人々はまた無意識の偏見を持っており、それは問題をさらに複雑にします。
エリックは彼の記事で、1970年代まで主にすべて男性だったオーケストラの例を使用しています。 人々は、男性の演奏者は女性の演奏者よりも音楽に対する適性が優れていると信じていました。 しかし、オーケストラがオーディション中に物理的なスクリーンでミュージシャンとジャッジを分離し始めると、数は大幅に変化し、人々は男性と女性が平均して同じように上手く演奏したことを受け入れ始めました。
同様のバイアスがテクノロジー業界の採用システムに影響を及ぼしている場合、先に説明した女性ソフトウェアエンジニアの割合が少ないことを説明するのに役立つ可能性があります。 また、採用されている女性ソフトウェアエンジニアの数が少ない場合、それらの影響はGitHubのようなオープンソースコミュニティに浸透する可能性があります。 誰かがフルタイムのプログラミングの役割で拒否された場合、彼らは彼らがそれほど才能がないと信じるようになるかもしれません、そしてそれ故にオープンソースプロジェクトに貢献する自信を持っている可能性が低くなります。
これはどこに私たちを残しますか?
これが私のために頭に浮かぶいくつかのフォローアップの質問です(そしてもっとたくさんあります):
1.これらの数値は時間の経過とともにどのように変化しますか?
より多くの女性をテクノロジー業界に参加させることは、現在非常に議論されているトピックであり、貢献を必要とするコーディングブートキャンプの台頭は、オープンソースに関しても含めて、プラスの影響を与えるはずです。 それらの議論とさまざまな新しいイニシアチブはどれほど効果的ですか? これらの数字は3年前にどのように見えるでしょうか? 5年前? 1年でどうですか?
2. GitHubデータを他にどのように分析できますか?
Anna-Chiaraは、フォークの数に基づいてユーザーの性別の内訳を調べ、女性のGitHubユーザーが何らかの方法でプロジェクトを実験している頻度を把握することを提案しました。 さらに、年齢層など、調査結果に影響を与える可能性のある他の要因もあります。 オープンソースは長い間テクノロジー業界の定番でしたが、GitHubは2008年に設立されました。
3.どのGitHubユーザーが偽の名前を使用しているかを確認する良い方法はありますか?
偽の名前を使用する女性の割合がGitHub全体の女性の割合よりもはるかに高い場合、それはGitHub(および一般的にはある程度の技術)がコミュニティとしてどれほど歓迎されているかについて非常に強力な声明を出します。
4.場所を見始めると、これらの数値はどのように変化しますか?
GitHubでのやり取りは理論的には場所に依存しないため、これは不完全です。 しかし、女性のGitHubユーザーの割合が平均よりも高い国の技術コミュニティから何かを学ぶことができますか?
そして、これらの数値を改善するためのいくつかのアイデアがあります(ここでも、もちろんもっとたくさんあります):
1.人気のあるGitHubリポジトリのページを改善できますか?
このトピックについてBozhidarと話し合ったとき、彼は、GitHubのほとんどのプロジェクト/コミュニティには、プロジェクトの初期段階で新しいオープンソースの貢献者を非常に忍耐強く歓迎し、喜んで案内するリーダーがいると述べました。 これはまったく一般的な知識ではないようです(オープンソースコミュニティは「サークルに入ることができなかった」と感じた女性開発者からの前述のコメントを思い出してください)。
新しいGitHubユーザーは、このタイプのメンターシップとサポートが存在することを認識していますか(彼が言うように普及していると仮定して)、新しいユーザーはそのようなガイダンスを簡単に見つける方法を知っていますか? 人気のあるGitHubリポジトリのインターフェースを改善して、これをより明確にし、より歓迎するようにすることはできますか? たとえば、人気のあるリポジトリページに公式の「リポジトリメンター」の役割のようなものが含まれている場合、歓迎的で経験豊富なユーザーが質問に答えることができた方がはるかに明確です。
2.より良い(そしてより普及している)「GitHub入門」ガイドを公開します。
プル/プッシュ、コミット、分岐などを説明することでGitHubの使用方法を説明する投稿はたくさんありますが、GitHubコミュニティ内でやり取りするためのガイドラインに関してはほとんど何も見つかりません(知っている場合)いずれか、コメントに関連リンクを投稿してください)。
スキルレベルに応じてGitHubコミュニティのエチケットとベストプラクティスをナビゲートするためのハウツーガイドは、オープンソースに貢献することの威嚇とスポットライトの要素を分解するのに役立つ場合があります。 これは間違いなく、より意欲的な新しい開発者が参加することを奨励する可能性があるものです。 Toptalからのこのようなガイドをお楽しみに。
3.より多くのメンターシップは、大きな違いを生む可能性があります。
Bozhidarは、新規参入者が基本的なタスクを開始するのを喜んで支援するプロジェクトに関与する開発者の重要性についてコメントし、Anna-Chiaraは、プロジェクトに飛び込んであなたの仕事を批判にさらすのは非常に恐ろしいことについて話しました。 オープンソースコミュニティを女性を含むすべての人にとってより歓迎するためにできることはたくさんあるようです。 ここでもToptalのイニシアチブにご期待ください!
GitHubの結果に驚いていますか? どういう意味だと思いますか?