データサイエンスのための上位の推測質問と有益な方法[2022]

公開: 2021-01-06

Guesstimateとは何ですか？

推測は、理論と評価の方法論的な方法です。それはあなたがより高い精度で効率的に働くのを助けます。結果を統合するのはデータの調査です。また、ビジネスアナリストまたはデータサイエンスおよびデータアーキテクトまたはデータ技術者の重要な部分でもあります。

意味：それはあなたが解決したい問題を理解することであり、その目的は何であり、なぜあなたはそれを解決したいのかということです。
定義：それは、プロセスのフローの特定のオブジェクトと入力および出力に関するものです。一言で言えば、説明。
推測：それは思考と結論についてです-あなたはあなたの問題の中で特定のオブジェクトを作成しています。
見積もり：特定の問題の数の見積もりについてです。
アイデアを思いつく：研究開発でアイデアを実装します。

推測的な質問で市場の規模を尋ねることができる場合、それは「市場規模」の質問と呼ばれます。

推測に関する基本的な質問は次のとおりです。

典型的な月曜日にニューヨークで何人の人が青を着ていますか？
飛行機にいくつのテニスボールを入れることができますか？

推測にアプローチする方法は？

推測の問題を解決するプロセスはかなり扱いやすいです：

最終的な量に影響を与える可能性のある実行可能なパラメータを調べて、その数を見積もります。
一歩下がって考えてください。
あなたの考えを明確にしてください。
あなたの考えを声に出してください。
単純な数学のアプローチ-

このアプローチは通常、推測する数が何らかの比率である場合に使用されます。タスクは分子と分母を取得することです。これで完了です。

1.一人当たりのアプローチ-

このアプローチは、推測する数が、地理内の個人、世帯、または人口レベルでの消費アイテムと見なすことができる場合に使用されます。

2.需要と供給のアプローチ-

このアプローチでは、アイテムの供給側または需要側（または両方）からの推測数を考慮する必要があります。

一般的に言えば、次の2つの方法のいずれかで推測を提案できます。

トップダウン方式
ボトムアップ方式

トップダウンでは、あなたは可能な限り最大の宇宙から始めます。そして、あなたの推測はその一部です。

一番広いベースが一番上にあります。次に、このユニバースに、ユニバースからの数を推測に適した数に減らす一連の条件またはフィルターを適用し続けます（ただし、それを配置したい場合）。

トップダウン見積もりプロセスの鍵は次のとおりです。

それは開始宇宙を正確に識別しています。
それはあなたの推測の問題に適用される関連する条件/フィルターとセグメントの数を正確に識別しています。
セグメント：多くの場合、最初にユニバースをバケットにセグメント化し、各セグメントに異なるフィルターを適用する必要があります。

データサイエンスに関する推測的な質問のヒント：

プレゼンテーションの練習：私たちは、あなたが完了した特定のソリューションの聴衆にプレゼンテーションの練習をしなければなりません。
分析の実践：分析は、与えられた問題について思考プロセスを作るために重要な役割を果たします。
数字で練習する：数字で遊んだり、カスタムロジックを作成したりすることは常に重要です。

データサイエンスの推測的な質問を解決するときは、次の点を理解する必要があります。

あなたはあなたの頭の中にいない誰かにこれを説明しています。解決策はあなたのためではありません。
同時に、各側面をまったく新しい推測に変えないように注意してください。あなたの知性と分析能力に左右されるのは簡単です。
質問に焦点を合わせます。分析の麻痺について聞いたことがありますか？

データサイエンスの推測的な質問の目的は何ですか？

状況を理解する能力を理解すること。
物事をつなぐ能力の範囲を理解し、答えに到達する。
さまざまなパラメータに優先順位を付けて却下する強さを知ること。
不十分な情報をどの程度うまく処理しているかを理解するため。

ここにデータサイエンスに関するいくつかの推測的な質問があります-

質問： 1UCIIrisデータセットでk-meansアルゴリズムを使用して実験を作成します。

この実験では、データセット内のすべての特徴を使用してk-meansクラスタリングを実行し、クラスタリングの結果をすべてのサンプルの真のクラスラベルと比較します。

マルチクラスロジスティック回帰モジュールを使用して、マルチクラス分類を実行し、そのパフォーマンスをk-meansクラスタリングのパフォーマンスと比較します。

質問：2非常に単純な形式で、適合率と再現率を説明しますか？

質問：3データセットが提供されている場合、ユーザーに対してどのMLアルゴリズムを使用するかをどのように決定しますか？

質問：4誤検知が多すぎる方がよいですか？または、偽陰性が多すぎますか？

質問：5モデルの精度とパフォーマンスとは何ですか？どのようなシナリオを適用できますか？

質問：6モデルに過剰適合していないことをどのように確認しますか？例を挙げて説明します。

質問：7二項分類ツリーアルゴリズムを実行する場合、非常に簡単です。バイナリアルゴリズムでは、ツリーはルートノードとそれに続く子ノードで分割する変数をどのように決定しますか？

質問：8 NumPyとSciPyはどのように説明されていますか？

質問：9分類器を使用してデータセットをインポートするデータセットの精度をチェックするための基本的な機械学習プログラムを作成しますか？

質問：10さまざまな変数に基づいて車の価格を予測する回帰アルゴリズムを作成します。

質問：11さまざまなネットワーク機能を使用して、バイナリ分類を使用して侵入/攻撃の一部であるネットワークアクティビティを検出するモデルを開発します。

質問：12ウィキペディアの説明に基づいて類似の組織をグループ化（クラスタリング）して見つける方法。

質問：13来月、誰がサブスクリプションを更新するかをどのように予測しますか？

これを解決するにはどのようなデータが必要ですか？
どんな分析をしますか？
どのような予測モデルのアルゴリズムが必要になるでしょうか？

質問：14ニックネーム（アレン、ボブ、アレックス、ティムなど）を実際の名前にどのようにマッピングしますか？

質問：15 RまたはPythonスクリプトを使用したバイナリ分類子を使用して、定期旅客便が遅延するかどうかの予測を作成します。

質問：16正規化された損失の列を削除して、データの準備とクリーンアップを伴う線形回帰を使用して自動車の価格を予測します。

欠測値が多いため、実験とモデルを作成します。

質問：17 14人を5人ずつの4つのチームに分割する方法はいくつありますか？

質問：18標準正規曲線の下の面積は？

1より大きい
1に等しい
1未満

質問：19さまざまな変数に基づいて車の価格を予測する回帰アルゴリズムを作成します。

質問：20あなたのマネージャーはあなたのトレーニング中に10000本の木でランダムフォレストモデルを構築するように頼みました、そしてあなたは0.00としてトレーニングエラーを得ました。しかし、テストでは、検証エラーは34.23でした。何が悪かったと思いますか？モデルが完全にトレーニングされていない場合、どのようにモデルをチェックしますか？

質問：21 「これを購入した人、また購入した人…」Amazonで見られる推奨事項は、どのアルゴリズムに基づいていますか？

質問：22 「今日のニュースと見解」として表示される推奨事項にリンクされているアルゴリズムはどれですか。

読む：データサイエンスのインタビューの質問

結論

この記事が、データサイエンスに関する推測的な質問と、それらを克服する方法を理解するのに役立つことを願っています。 upGradでこのようなより有用な記事を見つけるでしょう。 MBA、データサイエンス、機械学習など、幅広いコースを提供しています。業界最高の個人からのメンターシップを提供しています。

データサイエンスの学習に興味があり、この分野でのキャリアを選択する場合は、データサイエンスのIIIT-B＆upGradのエグゼクティブPGプログラムをチェックしてください。これは、働く専門家向けに作成され、10以上のケーススタディとプロジェクト、実践的なハンズオンワークショップを提供します。、業界の専門家とのメンターシップ、業界のメンターとの1対1、400時間以上の学習とトップ企業との仕事の支援。

推測の問題を解決するための理想的な手順は何ですか？

推測に基づく質問に答える前に、より良いアイデアを思いつくためにいくつかの点を覚えておくのが賢明です。これらのポイントは次のとおりです。回答を開始する前に、質問に関する疑問をすべてクリアする必要があります。インタビュアーに必要な数の関連する質問をすることができますが、数値計算につながる質問は避けてください。これはインタビュアーに悪影響を与える可能性があります。悪い印象を避けるために、「はい」または「いいえ」の質問に固執することをお勧めします。問題を一度に解決しようとしないでください。代わりに、問題を小さなサブ問題に分割してから、それぞれの小さな問題を解決しようとします。問題を6つ以上のステップに分割しないでください。この方法は、長い計算を行っても答えに到達するのに役立ちます。

Guesstimateとは何ですか？

推測とは、問題を理解し、それを解決するための適切なアプローチを見つけることです。それは理論と評価の方法論的な方法です。このような質問で最も重要なことは、解決策をどのように説明するかです。
ゲスト化は、特に最初に尋ねられた種類の質問を見るとき、困難な作業のように感じることがあります。大規模な複合企業の市場規模から収益や人口に至るまで、これらの量の一部を球場の近くでさえ計算することは現実的に不可能です。

推測の問題を解決するためのさまざまなアプローチは何ですか？

単純な数学のアプローチ-このアプローチは、ほとんどの場合、推定する数が何らかの比率である場合に使用されます。一人当たりのアプローチ-このアプローチは、推測する数が、地理的範囲内の個人、世帯、または人口レベルでの消費項目と見なすことができる場合に使用されます。需要と供給のアプローチ-このアプローチでは、供給側または需要側のいずれかから数を考慮する必要があります。