NETFLIX'te Veri Bilimi ve Makine Öğrenimi Uygulamaları
Yayınlanan: 2018-08-21Endüstriler Veri bilimini heyecan verici ve yaratıcı şekillerde kullanıyor. Veri Bilimi, çeşitli sektörlerin verimliliğini artıran beklenmedik yerlerde ortaya çıkıyor. İnsan karar verme sürecini güçlendiriyor ve daha önce hiç olmadığı kadar işin üst ve alt satırlarını etkiliyor. Endüstriler, uygulamalarını veri bilimi ve makine öğrenimi ile güçlendirerek milyonlarca müşteriyi memnun ediyor.
Bu blog dizisi, çeşitli şirketlerde veri bilimi ve makine öğreniminin ilginç uygulamaları hakkında konuşmayı amaçlamaktadır. Her blog yazısında bir şirket öne çıkarılacaktır. Bu blog dizisi, Google, Apple, LinkedIn, Uber, Instagram, Twitter, Instacart, Netflix, Washington post, Quora, Pinterest, Amazon, Medium, Microsoft vb. şirketlerin Veri Bilimi ve Makine öğreniminden güçlerini artırmak için nasıl yararlandıkları hakkında konuşacak. işletmeler. O halde bu diziye 'Netflix' ile başlayalım.
İçindekiler
NETFLIX
Netflix'in müşterilerine film veya dizi önermek için Öneri Sistemlerini kullandığı iyi bilinmektedir. Film önerilerinin yanı sıra, Netflix'in veri bilimi ve makine öğrenimini kullandığı daha az bilinen birçok alan vardır:
- Filmler ve şovlar için kişiselleştirilmiş Sanat Eserlerine karar verme
- Yaratıcı çalışmalar için bir gösteriden en iyi kareleri editörlere önermek
- Video kodlama, istemci tarafı ve sunucu tarafı algoritmalarındaki gelişmeler, videoyu önbelleğe alma vb. konularda karar vererek Hizmet Kalitesi (QoS) akışını iyileştirme
- Farklı üretim aşamalarını optimize etme
- A/B testi kullanarak çeşitli algoritmalarla deneyler yapmak ve nedensel çıkarsamaya karar vermek. İç içe geçme vb. kullanarak deney yapmak için geçen süreyi azaltın.
Kişiselleştirilmiş Sanat Eseri
Netflix tarafından önerilen her film, ilişkili Artwork ile birlikte gelir. Bir film önerisiyle gelen Artwork herkese nasip olmaz. Film tavsiyesi gibi, bir gösteriyle ilgili Sanat Çalışması da kişiselleştirilir. Tüm üyeler tek bir en iyi Sanat Eseri görmez. Belirli bir başlık için bir Sanat Eseri portföyü oluşturulacaktır. İzleyicinin zevkine ve tercihine bağlı olarak makine öğrenme algoritması, başlığı görüntüleme şansını en üst düzeye çıkaran bir sanat eseri seçecektir.
'Stranger Things' başlığı için oluşturulmuş bir Sanat Eseri portföyü: 
İş yerinde kişiselleştirme. Üst sıra – Aktris Uma Thurman'ı seven bir izleyici için sanat eseri önerildi. Alt sıra – Aktör John Travolta'yı seven bir izleyici için sanat eseri önerisi: 
Sanat eseri kişiselleştirme her zaman kolay değildir. Sanat eseri kişiselleştirmenin zorlukları var. İlk olarak, yalnızca Artwork kişiselleştirmesi için tek bir resim seçilebilir. Buna karşılık, aynı anda birçok film önerilebilir. İkinci olarak, sanat eseri önerisi, bir film tavsiye motoruyla birlikte çalışmalıdır. Genellikle film tavsiyesinin en üstünde yer alır. Üçüncüsü, kişiselleştirilmiş sanat eseri önerisi, diğer filmler için resim önerilerini dikkate almalıdır. Aksi takdirde monoton olacak sanat önerilerinde çeşitlilik ve çeşitlilik olmayacaktır. Dördüncüsü, Seanslar arasında aynı resim mi yoksa farklı bir resim mi gösterilmelidir. Her seferinde farklı görsellerin gösterilmesi izleyicinin kafasını karıştıracak ve ayrıca atıf sorununa yol açacaktır. Atıf sorunu, hangi Sanat Eserinin izleyiciyi gösteriyi izlemeye yönlendirdiğidir.
Sanat eseri kişiselleştirme, izleyicilerin içeriği keşfetmesinde önemli gelişmelere yol açar. Sanat Eseri Kişiselleştirme, yalnızca kişiselleştirilmiş bir tavsiyenin değil, aynı zamanda tavsiyenin üyelere nasıl yapıldığının ilk örneğidir. Netflix hala bu yeni gelişen tekniği aktif olarak araştırıyor ve mükemmelleştiriyor.
Birliktelik Kuralı Madenciliğine ve Uygulamalarına Genel Bir Bakış
Resim Keşfi Sanatı
Tek bir saatlik 'Stranger Things' 86.000 statik video karesinden oluşur. Tek bir sezon (10 bölüm) toplamda ortalama 9 milyon kareden oluşur. Netflix, küresel müşterilerine hitap etmek için düzenli olarak içerik ekliyor. Böyle bir durumda, 'Doğru' kişi için 'Doğru' eseri bulmak için elle hasat yapmak mümkün değildir. İnsan editörlerin, gösterinin benzersiz unsurlarını ortaya çıkaracak en iyi kareleri araması neredeyse imkansız. Bu zorluğun üstesinden gelmek için Netflix, gösterinin gerçek ruhunu gerçekten yakalayan en iyi kareleri yeniden ortaya çıkarmak için bir araç takımı oluşturdu.
Bir gösteri için en iyi kareleri otomatik olarak yakalamak için ardışık düzen: 
Çerçeve açıklamaları, görüntü sıralaması için kullanılan objektif sinyalleri yakalamak için kullanılır. Çerçeve açıklamaları elde etmek için bir video birden çok küçük parçaya bölünür. Bu parçalar, 'Archer' olarak bilinen bir çerçeve kullanılarak paralel olarak işlenir. Bu paralel işleme, Netflix'in çerçeve açıklamalarını ölçekte yakalamasına yardımcı oluyor. Her parça, çerçeve özelliklerini elde etmek için bir yapay görme algoritması tarafından işlenir. Örneğin, yakalanan çerçevenin özelliklerinden bazıları renk, parlaklık, kontrast vb.dir. Bir çerçevede neler olduğunu anlatan ve çerçeve açıklaması sırasında yakalanan bir özellik kategorisi yüz algılama, hareket tahmini, nesne algılama vb.'dir. Netflix ayrıca fotoğraf, sinematografi ve görsel estetik tasarımın temel ilkelerinden üçüncü kural vb. gibi çerçeve açıklamaları sırasında yakalanan bir dizi özelliği de belirledi.
Çerçeve açıklamasından sonraki adım görüntüleri sıralamaktır. Sıralama için dikkate alınan bazı faktörler aktörler, görüntülerin çeşitliliği, içeriğin olgunluğu vb.dir. Netflix, bir dizideki aktörlerin görüntülerini kümelemek, ana karakterlere öncelik vermek ve ikincil karakterlerin önceliklerini kaldırmak için derin öğrenme tekniklerini kullanıyor. Şiddet ve çıplaklık içeren karelere yetersiz puan veriliyor. Bu sıralama yöntemini kullanarak bir gösteri için en iyi kareler ortaya çıkar. Bu şekilde, sanat eseri ve editör ekibi, belirli bir bölüm için milyonlarca kareyle uğraşmak yerine üzerinde çalışacak bir dizi yüksek kaliteli görüntüye sahip olacak.

Üretimde Veri Bilimi
Netflix, orijinal içerik oluşturmak için bu yıl sekiz milyar dolar harcıyor. 20'den fazla dilde dünya çapında milyonlarca izleyici için oluşturulan içerik. Netflix'in orijinal içerik üretmek için Veri Bilimini kullanması bizi şaşırtmamalı. Aslında Netflix, içerik üretiminin her adımında Veri Bilimini kullanıyor.
Tipik olarak içerik üretmek, üretim öncesi, üretim ve üretim sonrası aşamalardan oluşacaktır. Planlama, bütçeleme vb. üretim öncesi yapılır. Ana çekimler prodüksiyonun bir parçasıdır. Düzenleme, ses karıştırma vb. adımlar post prodüksiyonun bir parçasıdır. Alt başlıkların eklenmesi ve teknik aksaklıkların giderilmesi, yerelleştirme ve kalite kontrolün bir parçasıdır. Şimdi veri biliminin üretimin her aşamasını optimize etmeye nasıl yardımcı olduğunu görelim.
Bir gösteri için en iyi kareleri otomatik olarak yakalamak için ardışık düzen: 
Daha önce de belirtildiği gibi, bütçeleme üretim öncesi sürecin bir parçasıdır. Üretim başlamadan önce birçok kararın alınması gerekir. Örneğin, çekim yeri. Veri bilimi, belirli bir yerin maliyet etkilerini analiz etmek için yaygın olarak kullanılmaktadır. Yaratıcı vizyon ve bütçeler hassas bir şekilde dengelenerek kararlar alınır. Maliyet minimizasyonu, içeriğin vizyonundan ödün vermeden yapılır.
Prodüksiyon, aylar süren binlerce çekim yapmayı içerir. Üretimin bir amacı olacak, ancak belirli kısıtlamalar altında gerçekleştirilmesi gerekiyor. Örneğin, kısıtlamalar, bir oyuncunun yalnızca bir hafta müsait olması, bir yerin yalnızca belirli günler için müsait olması, ekibin çalışma saatlerinin günde 8 saat olması, gündüz çekimi veya gece çekimi gibi zaman kısıtlamaları, ekip olabilir. çekimler arasında yer değiştirmek zorunda kalabilir. Tüm bu kısıtlamalarla bir çekim programı hazırlamak yönetmen için bir kabus olabilir. Matematiksel optimizasyon teknikleri burada bir amaç ve kısıtlamalarla kullanılmaktadır. Bu optimizasyon tekniği, kaba bir çekim programı verecektir. Bu program, ayarlamalarla daha da iyileştirildi.

Post prodüksiyon, daha fazla değilse de prodüksiyon kadar zaman alacaktır. Post prodüksiyondaki darboğazları kontrol etmek için veri görselleştirme teknikleri kullanılır. Post prodüksiyondaki trendi takip etmek ve geleceğe yansıtmak için görselleştirme teknikleri de kullanılır. Bu tahmin, çeşitli ekiplerin iş yükünü görmek ve ekibi uygun şekilde görevlendirmek için yapılır.

Yerelleştirmede, gösteriler bir dilden diğerine dublaj yapılır. Hangi dizilerin dublaj yapılması gerektiğine ilişkin önceliklendirme, veri analizine dayalı olarak belirlenir. Geçmişte popülerliği kanıtlanmış olan dublajlı içeriklere öncelik verilir. Kalite kontrol, ses ve video arasında senkronizasyon, altyazıların sesle senkronizasyonu vb. gibi sorunları kontrol eder. Kalite kontrolü, kodlamadan önce ve sonra yapılır (videoları farklı cihazlarda akış için farklı bit hızlarına sıkıştırma işlemi). Netflix, manuel kalite kontrol kontrollerinden geçmiş verileri topladı. Bu veriler geçmişte meydana gelen hataları, hataların bulunduğu video formatlarını, bu içeriğin alındığı ortakları, içeriğin türünü vb. içeriyordu. Evet, Netflix bu türde bir hata kalıbı gördü. kuyu. Bu verileri kullanarak, kalite kontrollerinin 'geçti' veya 'başarısız' olduğunu tahmin eden bir makine öğrenimi modeli oluşturuldu. Bir makine öğrenimi algoritması "başarısız" olduğunu tahmin ederse, bu varlık bir dizi manuel kalite kontrolünden geçer.
Hindistan'da Veri Bilimcileri İşe Alan En İyi Şirketler
Akış Kalitesi Deneyimi ve A/B testi
Veri bilimi, akış deneyiminin kalitesini sağlamak için yaygın olarak kullanılmaktadır. Ağ bağlantısının kalitesi, akış kalitesini sağlamak için tahmin edilir. Netflix, belirli bir konumda hangi şovun izleneceğini aktif olarak tahmin eder ve içeriği yakındaki sunucuda önbelleğe alır. İçeriğin önbelleğe alınması ve depolanması, internet trafiği düşük olduğunda yapılır. Bu, içeriğin arabellek olmadan yayınlanmasını ve müşteri memnuniyetinin en üst düzeye çıkarılmasını sağlar. A/B testi, mevcut algoritmada bir değişiklik yapıldığında veya yeni bir algoritma önerildiğinde yaygın olarak kullanılır. Çok daha az sayıda numune kullanarak A/B test sürecini hızlandırmak için serpiştirme ve tekrarlanan ölçümler gibi yeni teknikler kullanılır.
Sonuç olarak, Netflix'in müşterilerle etkileşim kurmak ve onları şaşırtmak için veri analizini kullandığı bazı yollar şunlardır. Derinlere dalmak ve bu harika şirketin veri bilimini nasıl kullandığı hakkında daha fazla bilgi edinmek istiyorsanız, Araştırma bloglarını ziyaret edin. Bloglarında keşfedilmeyi bekleyen bir makale hazinesi var.
Gelecek blog dizisinde, Instacart'ın veri bilimi ve makine öğreniminden nasıl yararlandığını görelim. Şimdi bu blogu okudunuz, bu makale hakkında ne düşündüğünüz hakkında geri bildirimde bulunun. Ayrıca gelecek serimde hangi firmayı görmek istediğinize dair önerilerde bulunun.
Dünyanın en iyi Üniversitelerinden veri bilimi derslerini öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.

