2022'de En İyi 30 Veri Ambarı Mülakat Sorusu ve Yanıtı [Yeni Başlayanlar ve Deneyimliler İçin]

Yayınlanan: 2021-01-06

Bu yazıda listelenen veri ambarı mülakat soruları , veri ambarı ve iş zekası kariyerinde olanlar için faydalı olacaktır. Makine öğreniminin ortaya çıkmasıyla birlikte, içgörüleri elde etmek ve sonuçları daha hızlı uygulamak için büyük miktarda verinin analiz edilmesi gerekiyor. Veri işleme adımlarının veri depolama, özümseme, getirme ve işleme olduğu günler geride kaldı. Ancak veri hacmi arttıkça bu tür verilerin işlenmesi ve anlık sonuçların gösterilmesi gerekmektedir.

Sağlık, BFSI, kamu hizmetleri ve birçok devlet kuruluşu gibi tüm işletmeler, veri biliminde veri ambarına geçiyor. Bunun bir sonucu olarak, büyük hacimli verileri analiz edebilmeleri ve ilgili içgörüleri sağlayabilmeleri için veri ambarında uzmanlığa sahip daha fazla profesyonel işe alınır. Böylece, veri ambarı görüşme soruları , görüşmeleri kolayca kırmak ve önemli bilgiler elde etmek için uygun hale gelir.

Büyük verileri işleme ve veritabanlarını yönetme konusunda tutkuluysanız, bir veri ambarı sizin için harika bir kariyer seçeneğidir. Bu yazıda, bir sonraki görüşme hazırlığınızda size yardımcı olabilecek veri ambarı görüşme sorularını bulacaksınız. Sorular temel düzeyden uzman düzeyine kadardır, bu nedenle hem daha yeni hem de deneyimli profesyoneller bu veri ambarı görüşme sorularından yararlanacaktır .

İçindekiler

Veri Ambarı Mülakat Soruları

S1: Veri ambarı açısından veri analitiği nedir?

Veri Analitiği, verilerden iş odaklı sonuçlar çıkarmak için ham verileri kontrol eden bilimdir. Veri ambarı, veri analizini sağlar.

S2: Konu odaklı bir veri ambarı tanımlayın?

Konu odaklı veri ambarları, verileri satış, müşteri ve ürün gibi belirli bir nokta etrafında depolar.

S3: OLAP ne anlama geliyor ve türleri nelerdir?

OLAP, yönetim için çok boyutlu verileri işleyen, yöneten ve toplayan bir sistemdir. Çevrimiçi Analitik İşleme anlamına gelir.

Aşağıda verilen dört tür OLAP Sunucusu vardır:

  • Hibrit OLAP
  • İlişkisel OLAP
  • Özel SQL Sunucuları
  • Çok boyutlu OLAP

S4: OLAP ve OLTP arasındaki fark nedir?

OLAP, iş kararlarında yardımcı olan veri analizi için kullanılan bir yazılım aracı iken OLTP, üç katmanlı bir mimaride kullanılan işlem odaklı bir uygulamadır. OLAP ve OLTP arasındaki bazı farklar aşağıdadır:

OLAP (Çevrimiçi Analitik İşleme) OLTP (Çevrimiçi İşlem İşleme)
Farklı veritabanlarından toplanan geçmiş verileri içerir. Operasyonel verileri içerir.
Veri analitiği, veri madenciliği ve karar vermede kullanılır. Uygulamaya yöneliktir ve işle ilgili çeşitli görevler için kullanılır.
Çok miktarda veri depolar ve TB'dedir. Az miktarda veri depolar ve MB, GB, vb. olarak depolanır.
Verilerin boyutu büyük olduğu için yavaş çalışır. Çok hızlı çalışır ve sorgular saklanan verilerin %5'inde gerçekleşir.
Yalnızca zaman zaman verilerin yedeklenmesine ihtiyaç duyar. Verilerin yedeklenmesi ve kurtarılması düzenli olarak gerçekleşir.
Esas olarak, nadiren meydana gelen yazma işlemi ile bir okuma işlemi için kullanılır. Hem okuma hem de yazma işlemleri için kullanılır.

S5: OLAP hangi işlevleri gerçekleştirir?

OLAP tarafından gerçekleştirilen birincil işlevlerden birkaçı Özet, Detaya Git, Toplama, Dilim ve Zar'dır.

S6: ER Şeması nedir?

ER Diyagramı, veritabanındaki varlıklar arasındaki ilişkileri gösteren Varlık-İlişki Şeması anlamına gelir.

S7: SCD nedir?

SCD, yavaş değişen boyutlar anlamına gelir ve kayıtların zaman içinde değiştiği durumlar için geçerlidir.

S8: SCD türlerini tanımlayın.

Aşağıda verilen 3 tip SCD vardır:

SCD 1: Yeni kayıt, orijinal kaydın yerini alır.

SCD 2: Yeni kayıt mevcut istemci tablosuna eklenir

SCD 3: Orijinal veriler, yeni verileri girmek için değişiklikler alır.

S9: Kar Tanesi Şeması nedir?

Snowflake Schema, birincil boyut tablosuna sahip bir şemadır. Birincil boyut tablosunda bir veya daha fazla boyut birleştirilebilir. Olgu tablosuyla birleşebilen tek tablodur.

S 10: Yıldız Şemasını tanımlayın.

Yıldız Şeması, tablonun, sonuçların veri ambarı ortamında kolayca kurtarılabileceği şekilde yönetilmesini ifade eder.

S11: BUS Şemasını tanımlayın.

BUS Şeması, bir olgu tablosu varsa, standartlaştırılmış tanım paketini ve onaylanmış boyutu içerir.

S 12: Meta Verileri Tanımlayın.

Verilerle ilgili verileri ifade eder. Meta veriler, alanların sıralaması, kullanılan birkaç sütun, alanların veri türleri, sınırlı genişlik ve sabit genişlik gibi ayrıntılardan oluşur.

S13: Çekirdek boyutu tanımlayın.

Core Dimension, esas olarak data mart veya tek bir olgu tablosu için kullanılan bir Boyut Tablosudur.

S14: Veri ambarındaki döngüleri tanımlayın.

Bu döngüler, veri ambarındaki tablolar arasında bulunur. Tablolar arasında herhangi bir döngü varsa, sorgu oluşturma daha fazla zaman alır ve bir bilmece oluşturur. Bu nedenle, tablolar arasında herhangi bir döngüden kaçınılması her zaman önerilir.

S15: XMLA'yı açıklayın.

XMLA, OLAP, veri madenciliği ve internet üzerinden kullanılabilen diğer veri kaynaklarından verilere erişmek için standart bir yöntem sunan Analiz için XML olarak adlandırılır. Keşfet ve çalıştır yöntemlerini kullanan basit bir nesne erişim protokolüdür. Keşif yöntemi, verileri internetten alır ve yürütme yöntemi, uygulamaları farklı veri kaynaklarına karşı yürütmek için kullanılır.

Okuyun: Veri Bilimi Mülakat Soruları

S16: Veritabanı ve veri ambarı arasındaki farkları açıklayın.

Veritabanı, veri depolama için ilişkisel modeli kullandığından, veri ambarından farklıdır. Buna karşılık, veri ambarı diğer şemaları kullanır ve başlangıç ​​şeması bunlardan biridir. Aşağıda bir veritabanı ile bir veri ambarı arasındaki bazı farklar verilmiştir:

Özellik Veri tabanı Veri deposu
Veri tipi İlişkisel veriler veya Nesneye yönelik veriler Büyük hacimli veriler
Operasyonlar Hareket işleme Veri modelleme ve veri analizi
Boyutlar İki boyutlu veri Çok boyutlu veri
veri tasarımı ER tabanlı Yıldız ve kar tanesi şeması
veri boyutu Küçük Büyük
işlevsellik Yüksek performans ve kullanılabilirlik Yüksek esneklik

S17: Küpü Veri ambarında tanımlayın.

Bir Veri ambarındaki küpler, çok boyutlu verilerin temsilidir. Küpün gövdesi veri değerlerinden oluşur ve küpün kenarı boyut üyelerini içerir.

S18. Veri ambarı türlerini açıklar mısınız?

Veri ambarı aşağıdaki 3 türdendir:

  1. Kurumsal Veri Ambarı: Kurumsal veri ambarında, çeşitli işlevsel alanlardan gelen kurumsal veriler merkezi bir şekilde birleştirilir. Bu, veri modelindeki herhangi bir nesneye ayrıntılı bir genel bakış sağlayan verilerin çıkarılmasına ve dönüştürülmesine yardımcı olur.
  2. Operasyonel Veri Deposu: Bu veri ambarı, verilere doğrudan veritabanından erişmeye yardımcı olur ve ayrıca işlem işlemeyi destekler. Daha sonra çeşitli iş operasyonlarını destekleyen farklı kaynaklardan gelen kontrast verilerini bütünleştirir.
  3. Data Mart: Bu veri ambarı, belirli bir işlevsel alan için verileri depolar. Ayrıca, veri ambarında depolanan alt kümeler biçimindeki verileri içerir. Kullanıcıların verimli bir şekilde analiz etmesi ve içgörü kazanması için büyük miktarda veriyi azaltır.

S19: Çok boyutlu OLAP ile ilişkisel OLAP arasında hangisi daha hızlı çalışır?

Çok boyutlu OLAP, İlişkisel OLAP'tan daha hızlı çalışır.

  1. Çok Boyutlu OLAP: MOLAP'ta veriler çok boyutlu küpte saklanır. Verilerin depolanması, PowerOLAP.olp dosyası gibi özel biçimlerde gerçekleşir. Bu ürünler excel ile uyumludur ve veri etkileşimlerini kolaylaştırır.
  2. İlişkisel OLAP: İlişkisel OLAP ürünlerinde, RDBMS'de verileri işlemek için kullanılan standart bir dil olan SQL ile ilişkisel veritabanına erişilebilir. İşlemi gerçekleştirirken, istemci isteklerini kabul eder ve bunlar daha sonra SQL sorgularına çevrilir ve ardından RDBMS'ye iletilir.

S20: Bölücü hiyerarşik kümeleme ile kümelemeli kümeleme arasındaki farkları açıklayın.

Aglomeratif hiyerarşik kümeleme yönteminde, kümeler aşağıdan yukarıya doğru okunur, bu da programın önce alt bileşeni ve ardından üst bileşeni okuduğu anlamına gelir. Öte yandan, bölücü hiyerarşik kümeleme, verilerin önce ebeveyn düzeyinde ve ardından alt düzeyde okunduğu yukarıdan aşağıya yaklaşımını kullanır.

Aglomeratif hiyerarşik yöntemde nesneler bulunur ve her nesne kendi kümesini oluşturur ve tüm bu kümeler birlikte büyük bir küme oluşturur. Bu yöntem esas olarak, tek bir büyük küme oluşana kadar gerçekleşen sürekli birleştirmeden oluşurken, bölmeli kümeleme yönteminde kümelerin bölünmesi gerçekleşir. Ana küme daha küçük kümelere bölünür. Bu küme bölünmesi, her küme tek bir nesneden oluşana kadar devam eder.

Daha fazla bilgi edinin: Veri Bilimi ve Veri Madenciliği: Veri Bilimi ve Veri Madenciliği Arasındaki Fark

S21: Bir veri ambarındaki bukalemun yöntemi nedir?

Chameleon, veri ambarındaki hiyerarşik kümeleme yöntemidir. Bu yöntem, düğümler ve kenarlardan oluşan seyrek grafik üzerinde çalışır. Bu düğümler veri öğelerini, kenarlar ise ağırlıkları temsil eder. Bu gösterimle, mevcut yöntemlerin eksiklikleri giderilerek veri kümeleri oluşturulabilir ve bunlara kolaylıkla erişilebilir. Yöntem iki aşamada çalışır:

  • İlk aşamada, grafik, veri öğelerinin birçok alt kümeye ayrıldığı bir parçası olarak bölümlenir.
  • İkinci aşamada, daha sonra birinci aşamada oluşturulan diğer alt kümelerle birleştirilebilecek özgün kümeler aranır.

S22: Yürütme planı nedir ve yürütme planı sırasında optimize edici hangi yaklaşımı kullanır?

Yürütme planı, optimize edici tarafından SQL sorgularının yürütülmesi için adım kombinasyonunu seçmek için kullanılan plandır. Optimize edici, SQL sorgularını yürütmek için en verimli adım kombinasyonunu seçer. Optimize edici, yürütme planındaki iki yaklaşımı kullanır, yani kural tabanlı ve maliyet tabanlı.

S23: ETL'de (Çıkarma, Dönüştürme ve Yükleme) kullanılan farklı araçlar nelerdir?

ETL araçlarının listesi aşağıdadır:

  • bilişim
  • kehanet
  • Veri Aşaması
  • Veri Kavşağı
  • Ab Initio
  • depo üreticisi

S24: Meta veriler ve veri sözlükleri nasıl farklıdır?

Meta veriler, verileri açıklar. Verinin kaynağı, veriyi kimin topladığı ve veri formatı gibi verilerle ilgili tüm bilgileri içerir. Veri ambarlarında saklanan verilerle ilgili bilgilerin anlaşılması çok önemlidir. Öte yandan, bir veri sözlüğü, veritabanının temel tanımıdır. Veri sözlüğü, veritabanında bulunan dosyalar, her dosyada bulunan kayıtların sayısı ve veritabanındaki alanlara ilişkin tüm bilgilerden oluşur.

S25: Sanal Veri ambarını tanımlayın.

Bir sanal veri ambarı, tüm verilerin toplu bir görünümünü sunar. Meta Verilerin mantıksal veri modeli gibidir ve geçmiş verisi yoktur. Sanal veri ambarı, ham verileri çevirmenin ve karar vericiler tarafından kullanılacak bir biçimde sunmanın en iyi yoludur. Veriler, son kullanıcıların verileri sanallaştırılmış bir biçimde görüntülemesini sağlayan anlamsal bir harita olarak temsil edilir.

Ayrıca Okuyun: Veri Analisti Mülakat Soruları ve Cevapları

S26: Veri ambarını tasarlamak için hangi yaklaşımlar kullanılıyor?

Veri ambarı tasarımı için kullanılan başlıca iki yaklaşım vardır:

  1. Inmon yaklaşımı: Önce veri ambarının oluşturulduğu, ardından veri marketlerinin oluşturulduğu yukarıdan aşağıya yaklaşımdır. Bu yaklaşımda, veri ambarı Kurumsal Bilgi Fabrikasının merkezi olarak hareket eder ve veri ambarı mantıksal bir çerçeve olarak hareket eder.
  2. Kimball yaklaşımı: İlk önce data mart'ın oluşturulduğu aşağıdan yukarıya yaklaşımdır. Data mart daha sonra eksiksiz veri ambarını oluşturmak için bütünleşir. Farklı veri marketlerinin entegrasyonuna veri ambarı veri yolu mimarisi denir.

S27: Gerçek zamanlı veri ambarı nedir ve faydaları nelerdir?

Gerçek zamanlı veri ambarı, gerçek zamanlı verileri oluştuğu anda yakalayan ve veri ambarında kullanılabilir hale getiren veri ambarı konseptidir.

Gerçek zamanlı bir veri ambarının faydaları:

  • Kolay karar vermede yardımcı olur.
  • Toplu iş penceresini kaldırır.
  • İdeal veri yüküyle ilgili sorunu çözer.
  • Veritabanındaki dönüşümleri çalıştırmak için optimize edilmiş bir yol sunar.
  • Verilerin hızlı bir şekilde kurtarılmasını sağlar.

S28: ETL döngüsünün 3 katmanlı mimarisini açıklayın.

ETL döngüsü aşağıdaki 3 katmandan oluşur:

  1. Aşama katmanı: Bu katman, birden çok veri yapısından çıkarılan verileri depolar.
  2. Veri entegrasyon katmanı: Aşama katmanından gelen veriler entegrasyon katmanı yardımıyla veritabanına aktarılır. Bu veriler daha sonra boyutlar, kümeler ve gerçekler olarak da adlandırılan hiyerarşik gruplar halinde düzenlenir. Boyutlar ve gerçekler birlikte şemayı oluşturur.
  3. Erişim katmanı: Son kullanıcılar, erişim katmanı aracılığıyla verilere erişir ve veri analizini gerçekleştirir.

S29: Veri temizleme nedir?

Veri temizleme, verilerin veri deposundan kalıcı olarak kaldırılması yöntemidir. Veri silme, verileri yalnızca geçici olarak kaldırırken, veri temizleme verileri kalıcı olarak kaldırdığından ve boş alan başka amaçlar için kullanıldığından, veri silme işleminden farklıdır. Veri temizleme farklı yöntemler kullanır. Temizlenen veriler gerekirse arşivlenebilir.

S30: Bir projedeki test aşamalarını tanımlayın.

ETL testi, aşağıda belirtildiği gibi beş aşamadan oluşur:

  1. Gereksinimler ve veri kaynakları tanımlama
  2. Veri toplama
  3. İş mantığının uygulanması
  4. Veri oluşturma ve yayınlama
  5. Raporlama

Ayrıca Bakın: Veri Bilimi ve Büyük Veri: Veri Bilimi ve Büyük Veri Arasındaki Fark

Özetliyor

Bunlar, bir sonraki görüşme hazırlığınızda size kesinlikle yardımcı olacak , en sık sorulan Veri ambarı görüşme sorularıydı . Veri ambarı hakkında daha fazla bilgi edinmek istiyorsanız upGrad'ı ziyaret edebilir ve daha derinlemesine bilgi edinebilirsiniz. Veri ambarı görüşme sorularını doğru bir şekilde anlamanıza yardımcı olacak ilgili bilgileri bulabilirsiniz .

Veri bilimi hakkında bilgi edinmek istiyorsanız, IIIT-B & upGrad'ın çalışan profesyoneller için oluşturulmuş ve 10'dan fazla vaka çalışması ve proje, uygulamalı uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk, 1 Endüstri danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.

Veri ambarında kariyere nasıl başlayabilirim?

Veri Ambarı, her kuruluş için artan veri toplama ve kullanımı nedeniyle talep gören bir iş pozisyonu haline geldi. Her kuruluş, verileri işleyebilecek ve verilerden içgörü elde etmek için bunları eyleme dönüştürülebilir içgörülere dönüştürebilecek profesyoneller arıyor.

Veri ambarına girmek için gerekli becerilerden bazıları şunlardır:

1. Birinci sınıf araştırma, problem çözme ve analiz becerileri.
2. Bilgisayar Bilimleri veya BT gibi diğer ilgili alanlarda lisans derecesi.
3. İlişkisel veritabanı teorisi hakkında doğru bilgi
4. Veri tabanı sistemleri ile 3-5 yıl çalışma deneyimi
5. Veri modelleme ve mimarisi ile çalışma deneyimi
6. Sözlü ve yazılı iletişime hakim olma.
7. Teknik ve teknik olmayan üyeler tarafından sağlanan bilgileri anlamak için dinlemede iyi

Bunlar, veri ambarı alanında kariyerlerini geliştirmek için üzerinde çalışmaya başlaması gereken becerilerden bazılarıdır.

Veri ambarında kariyere nasıl başlayabilirim?

Veri ambarı alanında kariyer yapmak için yerine getirmesi gereken belirli gereksinimler vardır.

1. İlk olarak, herhangi bir kişinin bilgisayar bilimi veya ilgili alanlarda lisans derecesine sahip olması gerekir.
2. SQL server kodlama ve yönetimi konusunda minimum 2 yıl deneyim önemlidir.
3. Sunucu entegrasyonunu anlama ve ETL araçlarıyla çalışma
4. Veri ambarı ve veri modelleme teknikleri hakkında doğru bilgi
5. Temel MS ofis becerileri

Bir kursa katılmak, tüm süreci sizin için oldukça basit hale getirebilir. Veritabanı yönetimi ve veritabanı yönetimi için farklı üniversiteler ve platformlar tarafından sunulan çok sayıda eğitim programı bulunmaktadır. Daha sonra, deneyim kazanmak ve alanın içini ve dışını anlamak için giriş seviyesi bir işe girebilirsiniz.

Herhangi bir şirkette veri ambarının farklı aşamaları nelerdir?

Şirket büyüklüğüne, yaşına ve sektöre bağlı olarak, veri ambarının aşamaları aşağıda belirtilen dördünde olacaktır.

1. Çevrimdışı Veritabanı
2. Çevrimdışı Veri Ambarı
3. Ream-time Veri Ambarı
4. Entegre Veri Ambarı

Her şirket 1. aşama ile başlar ve her şeyi iş sistemlerine entegre etmek için 4. aşamaya ulaşmaya çalışır. Veri ambarlarının düzgün çalışması, veri ambarı yöneticisinin verileri analiz etmesini ve ondan eyleme dönüştürülebilir içgörüler oluşturmasını kolaylaştırabilir.