AI Investment Primer: Meletakkan Dasar (Bagian I)
Diterbitkan: 2022-03-11Ringkasan bisnis plan
Apa itu AI?
- Artificial Intelligence (AI), secara sederhana dapat dijelaskan sebagai kecerdasan yang ditunjukkan oleh mesin, berbeda dengan kecerdasan alami yang ditampilkan oleh manusia dan hewan lainnya.
- Pembelajaran mesin adalah bagian dari teknik yang digunakan dalam AI, dan pembelajaran mendalam adalah bagian dari teknik yang digunakan dalam pembelajaran mesin.
- Ada tiga gelombang signifikan perkembangan AI. Yang pertama di tahun 50-an dan 60-an, yang kedua di tahun 80-an dan 90-an, dan yang ketiga dimulai satu dekade lalu dan menjadi terkenal sejak 2016 (AlphaGo).
Apa yang istimewa dari gelombang AI ini?
- Gelombang AI ini didorong oleh pertumbuhan dan popularitas pembelajaran mendalam.
- Sementara teknik pembelajaran mendalam telah ada sejak tahun 60-an, daya komputasi dan data yang dibutuhkan belum cukup maju untuk mendukung aplikasi komersial massal hingga beberapa tahun terakhir.
- Alasan mengapa pembelajaran mendalam sangat menarik adalah, sederhananya, pembelajaran mendalam memungkinkan kinerja yang jauh lebih kuat daripada algoritme pembelajaran lainnya.
Komponen kunci dari aplikasi AI yang sukses.
- Aplikasi AI perlu memecahkan masalah yang terdefinisi dengan baik (spesifik) dan diinginkan (menargetkan poin rasa sakit pelanggan yang mendesak dan jelas). Pengenalan wajah, terjemahan mesin, mobil tanpa pengemudi, optimisasi mesin pencari, semuanya didefinisikan dengan baik sebagai masalah yang diinginkan. Namun, kurangnya masalah yang diinginkan yang terdefinisi dengan baik adalah mengapa sulit untuk memproduksi, misalnya, robot pembersih rumah umum.
- Algoritme pembelajaran mesin memerlukan akses ke data yang bersih dan diberi label dengan baik. Latihan pengumpulan data ini bisa sulit atau mudah, tergantung pada aplikasi komersial yang Anda kembangkan.
- Bisnis AI perlu mengembangkan algoritme yang kuat dan skalabel. Untuk mencapai ini, ada tiga hal yang harus dimiliki: sejumlah besar data yang diberi label dengan baik, bakat yang tepat, dan keyakinan bahwa pembelajaran mendalam adalah teknologi yang tepat untuk memecahkan masalah.
- Aplikasi AI yang sukses membutuhkan banyak daya komputasi. Semakin maju algoritme kecerdasan buatan (misalnya jaringan saraf pembelajaran mendalam), semakin banyak daya komputasi yang diperlukan, semakin mahal biaya operasinya.
Selama beberapa tahun terakhir, dunia telah menyaksikan ledakan minat seputar Artificial Intelligence (AI). Sebuah konsep yang dulunya terbatas pada genre Sci-Fi, AI telah menjadi bagian dari kehidupan kita sehari-hari. Kami membacanya sepanjang waktu di berita, melihat video robot yang tampak menakutkan menari mengikuti irama Uptown Funk , dan mendengar tentang bagaimana aplikasi AI merayap bahkan ke bidang yang paling tak terduga dalam kehidupan kita sehari-hari. Tapi apakah itu hype?
Bisa jadi. Menurut Hype Cycle for Emerging Technologies Gartner, tren AI yang didemokratisasi termasuk AI PaaS (platform as a service), Artificial General Intelligence, Autonomous Driving, Deep Learning, semuanya berada di berbagai titik pada kurva, dengan Deep Neural Nets berada di puncak. harapan yang dibesar-besarkan. Namun, kami juga sudah mendapat manfaat dari AI setiap hari. Dari Siri hingga Cortana hingga Alexa, kini kita dapat berkomunikasi dengan asisten pintar. Dari mesin telusur Google yang diberdayakan AI hingga filter Instagram, kini kami menikmati kemudahan respons yang cepat dan lebih relevan dengan kebutuhan kami. Di Cina, di mana inovasi AI berkembang pesat, perusahaan seperti teknologi pengenalan wajah Face++ mendukung otentikasi ID instan untuk bank, sementara aplikasi seperti TikTok mendorong video pendek ke jutaan remaja (sebenarnya menimbulkan kontroversi yang cukup besar dalam melakukannya).
Saya pribadi percaya bahwa meskipun ada beberapa ekspektasi dan bisnis yang berlebihan, AI adalah masa depan . Saya mendirikan startup AI tahap awal saya sendiri untuk menangkap peluang sekali seumur hidup ini untuk berpartisipasi dalam revolusi teknologi. Sebagai mantan investor VC, saya juga terus mencari peluang investasi di AI. Oleh karena itu, saya percaya bahwa, terlepas dari kebisingan yang tidak dapat disangkal di sekitar ruang, lonjakan besar dalam investasi AI juga diperlukan.
Tetapi dengan pemikiran ini, saya terkejut bahwa, khususnya di antara komunitas investasi, masih ada kesenjangan pemahaman yang besar. Investor tertarik untuk menggunakan uangnya, tetapi mereka sering kekurangan pengetahuan dasar penting yang, menurut pendapat saya, diperlukan untuk menjadi investor yang efektif di bidang ini. Oleh karena itu, tujuan artikel ini adalah untuk berbagi dan memberikan beberapa konteks dan informasi yang berguna bagi mereka yang tertarik untuk berinvestasi di bidang yang menarik ini. Mengingat luasnya topik yang ada, saya telah membagi pemikiran saya menjadi dua bagian, yang pertama ditujukan untuk membahas beberapa elemen penting yang perlu diketahui untuk memulai perjalanan AI - 101 macam. Bagian kedua dari seri ini akan lebih praktis dan akan menyelami lebih dalam topik tentang bagaimana mengevaluasi investasi AI dan berbagai cara untuk berinvestasi.
NB Posting ini tidak dimaksudkan untuk teknis. Ini ditujukan untuk investor dan komunitas keuangan yang lebih luas, dan oleh karena itu pembaca non-teknis.
Apa itu AI?
Sebenarnya ada banyak definisi AI, jadi ketika saya diminta untuk mendefinisikannya, saya sering menggunakan Wikipedia lama, yang, untuk audiens non-teknis, menurut saya memberikan definisi yang memuaskan:
Kecerdasan buatan (AI), kadang-kadang disebut kecerdasan mesin, adalah kecerdasan yang ditunjukkan oleh mesin, berbeda dengan kecerdasan alami yang ditampilkan oleh manusia dan hewan lainnya.
Dengan kata lain, setiap kecerdasan non-alami adalah kecerdasan "buatan", terlepas dari bagaimana hal itu dicapai. Teknik yang digunakan untuk mencapai AI mencakup aturan jika-maka, logika, pohon keputusan, regresi, dan pembelajaran mesin termasuk pembelajaran mendalam. Salah satu alat favorit dan menyenangkan saya untuk menjelaskan cara kerja AI adalah video ini tentang cara komputer belajar memainkan Super Mario.
Ketika berbicara tentang AI, Anda akan selalu mendengar tiga istilah kunci ini: AI, pembelajaran mesin, dan pembelajaran mendalam. Mereka kadang-kadang digunakan secara bergantian, tetapi mereka berbeda. Sederhananya, pembelajaran mesin adalah bagian dari teknik yang digunakan dalam AI. Pembelajaran mendalam adalah bagian dari teknik yang digunakan dalam pembelajaran mesin .
Blog Nvidia melakukan pekerjaan yang baik untuk meringkas hubungan antara ketiga istilah tersebut. Ini juga memberikan gambaran praktis tentang tiga gelombang pengembangan AI. Gelombang pertama AI adalah di tahun 50-an dan 60-an dan melihat beberapa tonggak utama pertama seperti ketika IBM 701 memenangkan permainan catur atas master catur Robert Nealey. Di tahun 80-an dan 90-an, Deep Blue mengalahkan master manusia Kasparov di Catur. Pada bulan Maret 2016, AlphaGo mengalahkan Pemain Go #1 Lee Sedol. Setiap kali AI mengalahkan master manusia dalam game, itu memicu tahap hype baru untuk AI. Kemudian karena teknologi tidak dapat memberikan aplikasi yang memenuhi harapan publik, sensasi AI akan berubah menjadi musim dingin AI, dengan berkurangnya investasi dan hibah penelitian.
Seperti yang disebutkan sebelumnya, pembelajaran mesin adalah bagian dari AI. Menurut Nvidia, pembelajaran mesin pada dasarnya adalah “praktik menggunakan algoritma untuk mengurai data, belajar darinya, dan kemudian membuat penentuan atau prediksi tentang sesuatu di dunia. Jadi, alih-alih rutinitas perangkat lunak pengkodean tangan dengan serangkaian instruksi khusus untuk menyelesaikan tugas tertentu, mesin 'dilatih' menggunakan sejumlah besar data dan algoritme yang memberinya kemampuan untuk mempelajari cara melakukan tugas tersebut.” Contoh pembelajaran mesin yang sangat umum adalah filter spam. Filter spam Google dapat mengenali spam dengan mengidentifikasi kata-kata pemicu seperti “Pangeran”, “Nigeria”, dan “jam tangan mewah”. Itu juga dapat terus "belajar" dari klasifikasi spam manual pengguna. Misalnya, email dengan pesan "kirim $1000 untuk mendapatkan obat kanker eksklusif ini ke rekening bank berikut" tidak terjawab oleh filter spam Google. Setelah pengguna melabelinya sebagai spam, Gmail menganalisis semua kata kunci dalam email tersebut, dan “belajar” untuk memperlakukan email yang berisi kombinasi kata “$1000”, “obat”, dan “rekening bank” sebagai spam di masa mendatang. Ada banyak model matematika yang digunakan oleh para profesional untuk melakukan pembelajaran mesin, misalnya regresi, logistik, jaringan Bayesian, pengelompokan.
Apa yang istimewa dari gelombang AI ini?
Gelombang AI ini didorong oleh popularitas pembelajaran mendalam . Sebagai bagian dari pembelajaran mesin, pembelajaran mendalam tidak ditemukan baru-baru ini. Faktanya, menurut Wikipedia, “algoritma pembelajaran kerja umum pertama untuk perceptron yang diawasi, dalam, feedforward, multilayer diterbitkan oleh Alexey Ivakhnenko dan Lapa pada tahun 1965”. Namun, karena kekuatan komputasi dan data tidak cukup maju untuk mendukung aplikasi komersial massal teknik pembelajaran mendalam, itu tidak mendapatkan popularitas sampai tahun 2006 ketika Geoffrey Hinton dkk menerbitkan makalah mani mereka, “A Fast Learning Algorithm for Deep Belief Jaring.” Meskipun AI musim dingin tahun 90-an dan paruh pertama tahun 2000-an, beberapa sarjana, termasuk tiga guru akademik pembelajaran mendalam, Geoffrey Hinton, Yann LeCun, dan Yoshua Bengio, terus bekerja pada pembelajaran mendalam di bidang akademik. Terobosan cepat dari kekuatan komputasi, misalnya, komputasi awan dan GPU, ditambah dengan ketersediaan data besar melalui ekonomi digital, telah memungkinkan penerapan algoritma pembelajaran mendalam dalam dekade terakhir. Misalnya, penelitian mobil self-driving Google dimulai pada tahun 2009.

Secara teknis, pembelajaran mendalam dapat didefinisikan sebagai “kelas algoritma pembelajaran mesin yang:
- menggunakan kaskade beberapa lapisan unit pemrosesan nonlinier untuk ekstraksi fitur dan transformasi. Setiap lapisan yang berurutan menggunakan output dari lapisan sebelumnya sebagai input.
- belajar dengan cara yang diawasi (misalnya, klasifikasi) dan/atau tanpa pengawasan (misalnya, analisis pola).
- mempelajari berbagai tingkat representasi yang sesuai dengan tingkat abstraksi yang berbeda; level-level tersebut membentuk hierarki konsep.”
Kuncinya adalah “banyak lapisan”, dibandingkan dengan pembelajaran mesin tradisional. Misalnya, bagaimana Anda membedakan kucing dari anjing? Jika Anda menggunakan pembelajaran mesin, Anda mungkin mengekstrak beberapa fitur yang umum untuk anjing dan kucing, seperti dua telinga, wajah berbulu, jarak antara mata dan hidung dan mulut, dll. Dan Anda mungkin mendapatkan hasil yang mengatakan gambarnya 50% anjing, 50% kucing - tidak terlalu berguna. Namun, dengan menggunakan pembelajaran mendalam, Anda bahkan tidak tahu apa ciri khas kucing vs. anjing, tetapi mesin tersebut, melalui banyak lapisan menciptakan fitur baru dan ratusan (atau ribuan) model statistik, akan memberikan lebih banyak keluaran akurat - misalnya 90% anjing, 10% kucing. Dua bagan di bawah menggambarkan bagaimana jaringan saraf "belajar", dan perbedaan antara pembelajaran mesin klasik dan jaringan saraf.
Pembaca mungkin dibiarkan menggaruk-garuk kepala setelah membaca di atas, dan memang demikian. Tetapi kembali ke tujuan awal kami: dari sudut pandang investor, apa yang istimewa dari pembelajaran mendalam? Seseorang dapat menjawab pertanyaan ini dengan berbagai penjelasan teknis rumit lebih lanjut, tetapi secara sederhana, grafik di bawah di sebelah kiri melakukan pekerjaan yang sangat baik untuk memperjelasnya: pembelajaran mendalam memungkinkan kinerja yang jauh lebih kuat daripada algoritme pembelajaran lainnya. Ambil contoh pengenalan suara seperti yang dirinci oleh blog Microsoft (bagan di bawah di sebelah kanan): tingkat kesalahan pengenalan suara tahun 1988 yang asli adalah 60-70%, sedangkan sistem Microsoft baru yang menggunakan pembelajaran mendalam hanya 6,3% pada tahun 2014.
Komponen kunci dari aplikasi AI yang sukses
Saya percaya ada 4 komponen kunci keberhasilan produk pembelajaran mesin (termasuk pembelajaran mendalam): masalah yang diinginkan yang terdefinisi dengan baik, data, algoritme, dan daya komputasi .
Pertama dan terpenting, aplikasi AI perlu memecahkan masalah yang terdefinisi dengan baik (spesifik) dan diinginkan (menargetkan titik nyeri pelanggan yang mendesak dan jelas) . Pikirkan tentang berbagai permainan yang diajarkan komputer untuk dimainkan melalui 3 gelombang AI yang berbeda: catur, catur, Go. Mereka adalah masalah yang didefinisikan dengan sangat baik dan oleh karena itu lebih mudah untuk dipecahkan oleh komputer. Pengenalan wajah, terjemahan mesin, mobil tanpa pengemudi, optimisasi mesin pencari, semuanya didefinisikan dengan baik sebagai masalah yang diinginkan. Namun, kurangnya masalah yang diinginkan yang terdefinisi dengan baik adalah mengapa sangat sulit untuk memproduksi, misalnya, robot pembersih rumah umum. Tugas rumah tangga yang sederhana, misalnya mengumpulkan cangkir dan memasukkan cucian ke dalam keranjang, memerlukan penyelesaian terlalu banyak masalah. Misalnya, memerlukan mesin untuk mengidentifikasi benda apa yang perlu diambil (cangkir, cucian kotor dan cucian tidak bersih, dll), ke mana harus pergi, dan bagaimana menuju ke sana (menghindari rintangan dalam rumah tangga dan melakukan perjalanan ke tempat yang diinginkan. lokasi), menangani setiap objek dengan kekuatan yang diinginkan sehingga tidak merusak cangkir atau cucian, dll.
Kedua, mengembangkan algoritme pembelajaran mesin memerlukan akses ke data yang bersih dan berlabel baik . Ini karena algoritme ini dibangun dengan memberi makan model statistik yang berbeda sejumlah besar data yang diberi label dengan baik, untuk membangun hubungan prediktif yang diperlukan. Latihan pengumpulan data ini bisa sulit atau mudah, tergantung pada aplikasi komersial yang Anda kembangkan. Misalnya, untuk mengumpulkan data yang diperlukan untuk mengembangkan algoritma visi komputer untuk ladang anggur, startup saya membutuhkan gambar lapangan dari lokasi yang berbeda dengan varietas yang berbeda dan lebih sulit lagi - musim yang berbeda. Dengan setiap musim menjadi satu tahun, dibutuhkan waktu bertahun-tahun untuk mendapatkan produk yang memuaskan. Sebaliknya, jika Anda ingin mengembangkan algoritme pengenalan wajah yang baik di China, untuk mengumpulkan misalnya 10 juta gambar, Anda hanya perlu menyiapkan kamera di jalan yang sibuk di Beijing selama seminggu dan tugas selesai. Contoh lain adalah agregator berita pribadi bertenaga AI #1 di Cina, Toutiao, yang mempelajari tentang preferensi berita pribadi Anda dan hanya menampilkan berita yang paling relevan untuk Anda. Mengumpulkan data, dalam hal ini, sekali lagi jauh lebih mudah, misalnya jumlah artikel yang Anda baca di setiap kategori berita, jumlah waktu yang Anda habiskan untuk setiap artikel, dll.
Ketiga, bisnis AI perlu mengembangkan algoritme yang kuat dan skalabel . Untuk mencapai hal ini, ada tiga hal yang harus dimiliki: sejumlah besar data yang diberi label dengan baik (seperti yang dibahas di atas), bakat yang tepat, dan keyakinan bahwa pembelajaran mendalam adalah teknologi yang tepat untuk memecahkan masalah. Bisnis AI perlu memiliki bakat yang tepat untuk mengembangkan algoritme yang diperlukan, tetapi ini sangat terspesialisasi, mahal, dan langka. Misalnya, ketika saya sedang mencari perekrutan untuk startup saya, saya menemukan bahwa, minimal, saya membutuhkan ilmuwan data (biasanya PhD) untuk mengembangkan prototipe algoritma, insinyur untuk merancang kerangka kerja, programmer (TensorFlow, Python, C++ dll) untuk membuat kode. ke dalam program yang dapat diskalakan, dan orang-orang untuk menyatukannya (manajer produk, UX, UI, dll).
Pertimbangan lain adalah daya komputasi . Mengapa? Karena jaringan saraf pembelajaran mendalam membutuhkan lebih banyak komputasi daripada metode AI lainnya. Misalnya, untuk tugas yang sama dalam mengidentifikasi seekor anjing dalam sebuah gambar, melatih model menggunakan algoritme pembelajaran non-mendalam mungkin memerlukan, katakanlah, 10 model statistik dengan kumpulan data sebesar 1 GB. Model jaringan saraf dalam mungkin memerlukan, katakanlah, 1000 model statistik yang berjalan melalui kumpulan data 100 GB. Hasilnya lebih baik menggunakan jaringan, tetapi daya komputasi yang dibutuhkan jauh lebih besar. Akibatnya, model ini tidak hanya memerlukan satu komputer (seperti yang kami lakukan di komputer pribadi), tetapi komputasi terdistribusi dengan setiap penanganan GPU, katakanlah, 5% dari komputasi, sehingga 20 GPU bersama-sama dapat menangani volume komputasi yang diperlukan. Ini, pada gilirannya, berarti harus membangun server klaster GPU Anda sendiri atau menyewa daya komputasi dari platform seperti AWS. Daya komputasi dari komputasi awan atau server Anda sendiri mahal, meskipun dalam keadilan biaya unit komputasi harus terus menurun (sesuai hukum Moore).
Kesimpulan
Banyak yang percaya sekarang adalah waktu terbaik untuk melihat terobosan dan startup AI, karena digitalisasi banyak industri dan internet konsumen membuat sejumlah besar data digital yang dikumpulkan dengan sengaja, terorganisir dengan rapi, tersedia. Pengembangan GPU Nvidia dan FPGA Intel membuatnya jauh lebih murah dan lebih cepat untuk melakukan perhitungan yang diperlukan. Oleh karena itu, gelombang inovasi AI saat ini didorong oleh kemajuan penting dalam pembelajaran mendalam .
Tetapi agar aplikasi AI berhasil, seseorang membutuhkan masalah, data, algoritme, dan daya komputasi yang diinginkan yang terdefinisi dengan baik. Bagi para eksekutif yang membaca artikel ini yang mempertimbangkan untuk menggunakan AI untuk memberdayakan bisnis mereka, empat komponen utama yang disebutkan di atas juga berlaku.
Bagaimana Anda bisa belajar lebih banyak tentang AI? Ada banyak buku, seminar, kursus Coursera, makalah penelitian, dan organisasi seperti Deep Learning untuk belajar tentang AI. Karena fokus artikel ini adalah untuk investor yang ingin mengetahui dasar-dasar AI, saya tidak banyak menyentuh topik hangat AI seperti potensi AI sebagai ancaman, prospek industri di masa depan, investasi AI, pro dan kontra dari algoritma yang berbeda (misalnya CNN), prototyping vs scaling, bahasa pemrograman utama, dll Di Bagian 2 dari seri ini, saya akan mempelajari bagaimana mengevaluasi perusahaan AI dari perspektif investor.