Aplikasi Ilmu Data dan Pembelajaran Mesin di NETFLIX
Diterbitkan: 2018-08-21Industri menggunakan ilmu Data dengan cara yang menarik dan kreatif. Ilmu Data muncul di tempat-tempat yang tidak terduga meningkatkan efisiensi berbagai sektor. Ini memperkuat pengambilan keputusan manusia dan memengaruhi lini atas dan bawah bisnis tidak seperti sebelumnya. Industri memuaskan jutaan pelanggan dengan memperkuat aplikasi mereka dengan ilmu data dan pembelajaran mesin.
Seri blog ini bertujuan untuk membicarakan aplikasi menarik dari ilmu data dan pembelajaran mesin di berbagai perusahaan. Sebuah perusahaan akan disorot di setiap posting blog. Seri blog ini akan berbicara tentang bagaimana perusahaan seperti Google, Apple, LinkedIn, Uber, Instagram, Twitter, Instacart, Netflix, Washington Post, Quora, Pinterest, Amazon, Medium, Microsoft, dll. memanfaatkan Ilmu Data dan Pembelajaran Mesin untuk memberdayakan mereka bisnis. Jadi, mari kita mulai seri ini dengan 'Netflix'.
Daftar isi
NETFLIX
Diketahui bahwa Netflix menggunakan Sistem Rekomendasi untuk menyarankan film atau acara kepada pelanggannya. Selain rekomendasi film, ada banyak area lain yang kurang dikenal di mana Netflix menggunakan ilmu data dan pembelajaran mesin adalah:
- Memutuskan Karya Seni yang dipersonalisasi untuk film dan pertunjukan
- Menyarankan bingkai terbaik dari sebuah pertunjukan kepada editor untuk karya kreatif
- Meningkatkan kualitas layanan (QoS) streaming dengan memutuskan tentang pengkodean video, kemajuan di sisi klien dan sisi server algoritma, caching video dll
- Mengoptimalkan berbagai tahap produksi
- Bereksperimen dengan berbagai algoritma menggunakan pengujian A/B dan memutuskan inferensi kausal. Kurangi waktu yang dibutuhkan untuk bereksperimen menggunakan jalinan dll.
Karya Seni yang Dipersonalisasi
Setiap film yang direkomendasikan oleh Netflix dilengkapi dengan Karya Seni terkait. Karya Seni yang datang bersama dengan saran film tidak umum untuk semua orang. Seperti rekomendasi film, Karya Seni yang terkait dengan pertunjukan juga dipersonalisasi. Semua anggota tidak melihat satu Artwork terbaik. Portofolio Karya Seni akan dibuat untuk judul tertentu. Bergantung pada selera dan preferensi, algoritma pembelajaran mesin audiens akan memilih karya seni yang memaksimalkan peluang untuk melihat judul.
Portofolio Artwork yang dibuat dengan judul 'Stranger Things':
Personalisasi di tempat kerja. Baris atas – Karya seni disarankan untuk pemirsa yang menyukai aktris Uma Thurman. Baris bawah – Saran karya seni untuk pemirsa yang menyukai aktor John Travolta:
Personalisasi karya seni tidak selalu mudah. Ada tantangan untuk personalisasi karya seni. Pertama, satu gambar hanya dapat dipilih untuk personalisasi Karya Seni. Sebaliknya, banyak film dapat direkomendasikan sekaligus. Kedua, saran karya seni harus bekerja sama dengan mesin rekomendasi film. Itu biasanya duduk di atas rekomendasi film. Ketiga, rekomendasi karya seni yang dipersonalisasi harus mempertimbangkan saran gambar untuk film lain. Jika tidak, tidak akan ada variasi dan keragaman dalam saran karya seni yang akan monoton. Keempat, Haruskah karya seni yang sama atau yang berbeda ditampilkan di antara sesi. Setiap kali menampilkan gambar yang berbeda akan membingungkan pemirsa dan juga akan menyebabkan masalah atribusi. Masalah atribusi adalah Karya Seni mana yang mengarahkan penonton untuk melihat pertunjukan.
Personalisasi karya seni menghasilkan peningkatan signifikan dalam menemukan konten oleh pemirsa. Personalisasi Karya Seni adalah contoh pertama dari tidak hanya rekomendasi yang dipersonalisasi tetapi juga bagaimana rekomendasi tersebut diberikan kepada anggota. Netflix masih aktif meneliti dan menyempurnakan teknik yang baru lahir ini.
Gambaran Umum Penambangan Aturan Asosiasi dan Aplikasinya
Seni Penemuan Gambar
Satu jam 'Stranger Things' terdiri dari 86.000 bingkai video statis. Satu musim (10 episode) terdiri dari rata-rata 9 juta total frame. Netflix menambahkan konten secara teratur untuk melayani pelanggan globalnya. Dalam situasi seperti itu, tidak mungkin untuk memanen secara manual untuk menemukan karya seni yang 'Benar' untuk orang yang 'Tepat'. Hampir tidak mungkin bagi editor manusia untuk mencari bingkai terbaik yang akan menonjolkan elemen unik dari pertunjukan. Untuk mengatasi tantangan ini dalam skala besar, Netflix membuat seperangkat alat untuk memunculkan kembali bingkai terbaik yang benar-benar menangkap semangat pertunjukan yang sebenarnya.
Pipeline untuk secara otomatis menangkap bingkai terbaik untuk pertunjukan:
Anotasi bingkai digunakan untuk menangkap sinyal objektif yang digunakan untuk peringkat gambar. Untuk mencapai anotasi bingkai, video dibagi menjadi beberapa bagian kecil. Potongan ini diproses secara paralel menggunakan kerangka kerja yang dikenal sebagai 'Archer'. Pemrosesan paralel ini membantu Netflix menangkap anotasi bingkai dalam skala besar. Setiap bagian ditangani oleh algoritma visi mesin untuk mendapatkan karakteristik bingkai. Misalnya, beberapa properti bingkai yang ditangkap adalah warna, kecerahan, kontras, dll. Kategori fitur yang akan memberi tahu apa yang terjadi dalam bingkai dan ditangkap selama anotasi bingkai adalah deteksi wajah, estimasi gerakan, deteksi objek, dll. Netflix juga mengidentifikasi serangkaian properti dari prinsip inti fotografi, sinematografi, dan desain estetika visual seperti aturan sepertiga, dll., yang ditangkap selama anotasi bingkai.
Langkah selanjutnya setelah anotasi bingkai adalah memberi peringkat pada gambar. Beberapa faktor yang dipertimbangkan untuk peringkat adalah aktor, keragaman gambar, kematangan konten, dll. Netflix menggunakan teknik pembelajaran mendalam untuk mengelompokkan gambar aktor dalam sebuah pertunjukan, memprioritaskan karakter utama, dan tidak memprioritaskan karakter sekunder. Bingkai dengan kekerasan dan ketelanjangan diberi skor yang sedikit. Dengan menggunakan metode peringkat ini, bingkai terbaik untuk sebuah pertunjukan akan muncul. Dengan cara ini, karya seni dan tim editorial akan memiliki serangkaian gambar berkualitas tinggi untuk dikerjakan alih-alih berurusan dengan jutaan bingkai untuk episode tertentu.

Ilmu Data dalam Produksi
Netflix menghabiskan delapan miliar dolar tahun ini untuk membuat konten asli. Konten dibuat untuk jutaan pemirsa di seluruh dunia dalam lebih dari 20 bahasa. Seharusnya tidak mengejutkan kami jika Netflix menggunakan Ilmu Data untuk memproduksi konten asli. Faktanya, Netflix menggunakan Ilmu Data dalam setiap langkah produksi konten.
Biasanya memproduksi konten akan terdiri dari tahap pra-produksi, produksi dan pasca-produksi. Perencanaan, penganggaran dll terjadi di pra-produksi. Fotografi utama adalah bagian dari produksi. Langkah-langkah seperti pengeditan, pencampuran suara, dll. adalah bagian dari pasca produksi. Menambahkan sub-judul dan menghapus gangguan teknis adalah bagian dari lokalisasi dan kontrol kualitas. Sekarang mari kita lihat bagaimana ilmu data membantu mengoptimalkan setiap tahap produksi.
Pipeline untuk secara otomatis menangkap bingkai terbaik untuk pertunjukan:
Seperti yang dikatakan sebelumnya, penganggaran adalah bagian dari pra-produksi. Banyak keputusan yang perlu diambil sebelum produksi dimulai. Misalnya, lokasi pemotretan. Ilmu data banyak digunakan untuk menganalisis implikasi biaya dari lokasi tertentu. Keputusan diambil dengan hati-hati menyeimbangkan visi kreatif dan anggaran. Minimisasi biaya dilakukan tanpa mengorbankan visi konten.
Produksi melibatkan pengambilan gambar ribuan tembakan selama berbulan-bulan. Produksi akan memiliki tujuan, tetapi perlu dilakukan di bawah batasan tertentu. Misalnya, kendala dapat berupa aktor hanya tersedia selama satu minggu, lokasi hanya tersedia untuk hari-hari tertentu, jam kerja untuk kru adalah 8 jam per hari, kendala waktu seperti pengambilan gambar siang hari atau pengambilan gambar malam hari, tim mungkin harus memindahkan lokasi di antara pemotretan. Menyiapkan jadwal syuting dengan segala kendala tersebut bisa menjadi mimpi buruk bagi sang sutradara. Teknik optimasi matematika digunakan di sini dengan tujuan dan kendala. Teknik optimasi ini akan memberikan jadwal pengambilan gambar yang kasar. Jadwal ini disempurnakan lebih lanjut dengan penyesuaian.

Pasca produksi akan memakan waktu sebanyak produksi jika tidak lebih. Teknik visualisasi data digunakan untuk memeriksa kemacetan di pasca produksi. Teknik visualisasi juga digunakan untuk melacak tren pasca produksi dan memproyeksikannya ke masa depan. Peramalan ini dilakukan untuk melihat beban kerja berbagai tim dan kepegawaian tim secara tepat.

Dalam lokalisasi, pertunjukan di-dubbing dari satu bahasa ke bahasa lain. Prioritas acara mana yang perlu di-dubbing ditentukan berdasarkan analisis data. Konten berjuluk yang terbukti populer di masa lalu diprioritaskan. Kontrol kualitas akan memeriksa masalah seperti sinkronisasi antara audio dan video, sinkronisasi subtitle dengan suara, dll. Kontrol kualitas dilakukan sebelum dan sesudah penyandian (proses mengompresi video ke bitrate yang berbeda untuk streaming pada perangkat yang berbeda). Netflix mengumpulkan data historis dari pemeriksaan kontrol kualitas manual. Data ini terdiri dari kesalahan yang terjadi di masa lalu, format video tempat kesalahan ditemukan, mitra dari mana konten ini diperoleh, genre konten, dll. Ya, Netflix melihat pola kesalahan dalam genre sebagai dengan baik. Dengan menggunakan data ini, model pembelajaran mesin dibuat yang memprediksi 'lulus' atau 'gagal' dari pemeriksaan kualitas. Jika algoritme pembelajaran mesin memprediksi 'gagal', aset tersebut akan melalui pemeriksaan kualitas manual.
Perusahaan Teratas Mempekerjakan Ilmuwan Data di India
Kualitas Pengalaman Streaming dan pengujian A/B
Ilmu data banyak digunakan untuk memastikan kualitas pengalaman streaming. Kualitas konektivitas jaringan diprediksi akan menjamin kualitas streaming. Netflix secara aktif memprediksi acara mana yang akan ditayangkan di lokasi tertentu dan menyimpan konten di server terdekat. Caching dan penyimpanan konten dilakukan saat lalu lintas internet rendah. Ini memastikan konten dialirkan tanpa buffer dan kepuasan pelanggan dimaksimalkan. Pengujian A/B digunakan secara ekstensif setiap kali perubahan dilakukan pada algoritme yang ada, atau algoritme baru diusulkan. Teknik baru seperti interleaving dan langkah-langkah berulang digunakan untuk mempercepat proses pengujian A/B menggunakan jumlah sampel yang sangat sedikit.
Sebagai kesimpulan, berikut adalah beberapa cara Netflix menggunakan analisis data untuk melibatkan dan membuat kagum pelanggan. Jika Anda tertarik untuk menyelam lebih dalam dan mengetahui lebih banyak tentang bagaimana perusahaan luar biasa ini menggunakan ilmu data, kunjungi blog Penelitian mereka. Ada harta karun artikel di blog mereka yang menunggu untuk dijelajahi.
Dalam seri blog yang akan datang, mari kita lihat bagaimana Instacart memanfaatkan ilmu data dan pembelajaran mesin. Sekarang Anda telah membaca blog ini, berikan tanggapan Anda tentang apa yang Anda pikirkan tentang artikel ini. Juga, tawarkan saran mengenai perusahaan mana yang ingin Anda lihat di seri masa depan saya.
Pelajari kursus ilmu data dari Universitas top dunia. Dapatkan Program PG Eksekutif, Program Sertifikat Tingkat Lanjut, atau Program Magister untuk mempercepat karier Anda.
