AI Investment Primer: Temeli Atma (Bölüm I)

Yayınlanan: 2022-03-11

Yönetici Özeti

AI nedir?

Yapay Zeka (AI), insanlar ve diğer hayvanlar tarafından gösterilen doğal zekanın aksine, makinelerin gösterdiği zeka olarak basitçe açıklanabilir.
Makine öğrenimi, yapay zekada kullanılan tekniklerin bir alt kümesidir ve derin öğrenme, makine öğreniminde kullanılan tekniklerin bir alt kümesidir.
AI gelişiminin üç önemli dalgası olmuştur. Birincisi 50'li ve 60'lı yıllarda, ikincisi 80'li ve 90'lı yıllarda ve üçüncüsü on yıl önce başladı ve 2016'dan beri öne çıktı (AlphaGo).

Bu yapay zeka dalgası hakkında özel olan nedir?

Bu yapay zeka dalgası, derin öğrenmenin büyümesi ve popülaritesi tarafından yönlendiriliyor.
Derin öğrenme teknikleri 60'lı yıllardan beri var olsa da, gerekli bilgi işlem gücü ve veriler, son birkaç yıla kadar toplu ticari uygulamaları destekleyecek kadar gelişmiş değildi.
Derin öğrenmenin bu kadar heyecan verici olmasının nedeni, basitçe söylemek gerekirse, derin öğrenmenin diğer öğrenme algoritmalarından çok daha güçlü performansa izin vermesidir.

Başarılı AI uygulamalarının temel bileşenleri.

Yapay zeka uygulamalarının iyi tanımlanmış (spesifik) ve arzu edilen (acil ve net müşteri sıkıntı noktalarını hedefleyen) bir sorunu çözmesi gerekir. Yüz tanıma, makine çevirisi, sürücüsüz arabalar, arama motoru optimizasyonu, hepsi iyi tanımlanmış arzu edilen problemlerdir. Bununla birlikte, iyi tanımlanmış arzu edilen problemlerin olmaması, örneğin genel bir ev temizlik robotu üretmenin zor olmasının nedenidir.
Makine öğrenimi algoritmaları, temiz ve iyi etiketlenmiş verilere erişim gerektirir. Bu veri toplama çalışması, geliştirmekte olduğunuz ticari uygulamaya bağlı olarak zor veya kolay olabilir.
Bir yapay zeka işinin sağlam ve ölçeklenebilir algoritmalar geliştirmesi gerekir. Bunu başarmak için olmazsa olmaz üç şey vardır: büyük miktarda iyi etiketlenmiş veri, doğru yetenek ve derin öğrenmenin sorunu çözmek için doğru teknoloji olduğuna dair güven.
Başarılı AI uygulamaları çok fazla bilgi işlem gücü gerektirir. Yapay zeka algoritması (örn. derin öğrenme sinir ağları) ne kadar gelişmişse, o kadar fazla hesaplama gücü gerekir, eldeki işlem o kadar maliyetli olur.

Son birkaç yılda dünya, Yapay Zeka (AI) ile ilgili bir ilgi patlamasına tanık oldu. Bir zamanlar öncelikle Bilim Kurgu türüyle sınırlı olan bir kavram olan AI, günlük hayatımızın bir parçası haline geldi. Haberlerde sürekli okuyoruz, Uptown Funk melodisiyle dans eden korkutucu görünümlü robotların videolarını izliyoruz ve AI uygulamalarının günlük hayatımızın en beklenmedik alanlarına bile nasıl sızdığını duyuyoruz. Ama bu bir yutturmaca mı?

Olabilir. Gartner'ın Gelişmekte Olan Teknolojiler için Hype Cycle'a göre, AI PaaS (hizmet olarak platform), Yapay Genel Zeka, Otonom Sürüş, Derin Öğrenme dahil olmak üzere Demokratikleştirilmiş AI trendlerinin tümü eğrinin çeşitli noktalarında yer alıyor ve Derin Sinir Ağları en yüksek noktada yer alıyor. şişirilmiş beklentiler. Bununla birlikte, zaten her gün AI'dan da yararlanıyoruz. Siri'den Cortana'ya ve Alexa'ya artık akıllı asistanlarla sohbet edebiliyoruz. Google'ın yapay zeka destekli arama motorundan Instagram filtrelerine kadar, artık ihtiyaçlarımıza daha hızlı ve daha alakalı yanıt vermenin rahatlığını yaşıyoruz. AI inovasyonunun geliştiği Çin'de, Face++'ın yüz tanıma teknolojisi gibi şirketler bankalar için anında kimlik doğrulamasını desteklerken, TikTok gibi uygulamalar milyonlarca gence kısa videolar gönderiyor (aslında bunu yaparken ciddi tartışmalara yol açıyor).

2018'de gelişen teknolojiler için heyecan döngüsünü gösteren grafik.

Şahsen, kesinlikle aşırı derecede abartılı beklentiler ve işler olmasına rağmen, AI'nın gelecek olduğuna inanıyorum. Teknoloji devrimine katılmak için hayatta bir kez karşılaşılabilecek bu fırsatı yakalamak için kendi erken aşama yapay zeka girişimimi kurdum. Eski bir VC yatırımcısı olarak, sürekli olarak yapay zekada yatırım fırsatları arıyorum. Bu nedenle, alanı çevreleyen inkar edilemez gürültüye rağmen, AI yatırımındaki büyük artışın da garanti edildiğine inanıyorum.

Ancak bunu akılda tutarak, özellikle yatırım topluluğu arasında hala büyük bir anlayış boşluğu olması beni şaşırtıyor. Yatırımcılar parayı işe koymaya heveslidirler, ancak bence bu alanda etkili bir yatırımcı olmak için gerekli olan temel bilgilerden çoğu zaman yoksundurlar. Bu makalenin amacı, bu nedenle, bu heyecan verici alana yatırım yapmak isteyenler için bazı yararlı bağlam ve bilgileri paylaşmak ve sağlamaktır. Eldeki konunun genişliği göz önüne alındığında, düşüncelerimi iki bölüme ayırdım, ilki AI yolculuğuna başlamak için bilmesi gereken birkaç temel unsuru tartışmayı amaçlıyordu - bir tür 101. Bu dizinin ikinci kısmı daha pratik olacak ve yapay zeka yatırımlarının nasıl değerlendirileceği ve yatırım yapmanın farklı yolları konusuna daha derinden inecek.

NB Bu yazının teknik olması amaçlanmamıştır. Yatırımcılara ve daha geniş finansal topluluğa ve dolayısıyla teknik olmayan okuyuculara yöneliktir.

AI nedir?

Aslında yapay zekanın birçok tanımı var, bu yüzden onu tanımlamam istendiğinde genellikle varsayılan olarak eski ve eski Wikipedia'ya geçiyorum, ki bu da teknik bilgisi olmayan izleyiciler için tatmin edici bir tanım sağlıyor:

Bazen makine zekası olarak da adlandırılan yapay zeka (AI), insanlar ve diğer hayvanlar tarafından gösterilen doğal zekanın aksine, makineler tarafından gösterilen zekadır.

Başka bir deyişle, nasıl elde edildiğine bakılmaksızın, doğal olmayan herhangi bir zeka “yapay” zekadır. Yapay zeka elde etmek için kullanılan teknikler, eğer-öyleyse kuralları, mantığı, karar ağaçları, regresyonlar ve derin öğrenme dahil makine öğrenimini içerir. AI'nın nasıl çalıştığını açıklamak için en sevdiğim ve eğlenceli araçlardan biri, bir bilgisayarın Super Mario oynamayı nasıl öğrendiğiyle ilgili bu video.

AI hakkında konuşurken, her zaman şu üç anahtar terimi duyacaksınız: AI, makine öğrenimi ve derin öğrenme. Bazen birbirlerinin yerine kullanılırlar, ancak farklıdırlar. Basitçe söylemek gerekirse, makine öğrenimi, AI'da kullanılan tekniklerin bir alt kümesidir. Derin öğrenme, makine öğreniminde kullanılan tekniklerin bir alt kümesidir .

Nvidia blogu, üç terim arasındaki ilişkiyi özetlemek için iyi bir iş çıkarıyor. Ayrıca, AI geliştirmenin üç dalgasına kullanışlı bir genel bakış sağlar. AI'nın ilk dalgası 50'li ve 60'lı yıllardaydı ve IBM 701'in dama ustası Robert Nealey üzerinde dama oyununu kazanması gibi ilk önemli kilometre taşlarından bazılarını gördü. 80'li ve 90'lı yıllarda Deep Blue, insan ustası Kasparov'u Satranç'ta yendi. Mart 2016'da AlphaGo, 1 numaralı Go Oyuncusu Lee Sedol'u yendi. AI oyunlarda insan ustalarını her yendiğinde, AI için yeni bir heyecan sahnesi ateşledi. Daha sonra teknoloji, halkın beklentilerini karşılayan uygulamalar sağlayamadığı için, AI hype, azalan yatırımlar ve araştırma hibeleriyle AI kışına dönüşecekti.

AI geliştirmenin farklı aşamalarını gösteren grafik.

Daha önce de belirtildiği gibi, makine öğrenimi yapay zekanın bir alt kümesidir. Nvidia'ya göre, makine öğrenimi en temelde “verileri ayrıştırmak, ondan öğrenmek ve daha sonra dünyadaki bir şey hakkında bir belirleme veya tahmin yapmak için algoritmaları kullanma pratiğidir. Bu nedenle, belirli bir görevi yerine getirmek için belirli bir dizi talimat içeren yazılım rutinlerini elle kodlamak yerine, makine, ona görevi nasıl gerçekleştireceğini öğrenme yeteneği veren büyük miktarda veri ve algoritma kullanarak "eğitilir". Çok yaygın bir makine öğrenimi örneği spam filtresidir. Google'ın spam filtresi, "Prens", "Nijerya" ve "lüks saat" gibi tetikleyici kelimeleri tanımlayarak spam'i tanıyabilir. Ayrıca, kullanıcıların manuel spam sınıflandırmasından “öğrenmeye” devam edebilir. Örneğin, "bu özel kanser ilacını aşağıdaki banka hesabına almak için 1000 dolar gönderin" mesajını içeren bir e-posta, Google'ın spam filtresi tarafından kaçırıldı. Bir kullanıcı bunu spam olarak etiketlediğinde, Gmail söz konusu e-postadaki tüm anahtar kelimeleri analiz eder ve "$1000", "uyuşturucu" ve "banka hesabı" kombinasyon sözcüklerini içeren e-postaları ileride spam olarak ele almayı "öğrenir". Profesyoneller tarafından makine öğrenimi yapmak için kullanılan birçok matematiksel model vardır, örneğin regresyon, lojistik, Bayes ağları, kümeleme.

Bu yapay zeka dalgası hakkında özel olan nedir?

Bu yapay zeka dalgası, derin öğrenmenin popülaritesi tarafından yönlendiriliyor. Makine öğreniminin bir alt kümesi olarak derin öğrenme yakın zamanda icat edilmedi. Aslında Wikipedia'ya göre, "denetimli, derin, ileri beslemeli, çok katmanlı algılayıcılar için ilk genel, çalışan öğrenme algoritması 1965'te Alexey Ivakhnenko ve Lapa tarafından yayınlandı". Bununla birlikte, bilgi işlem gücü ve veriler, derin öğrenme tekniklerinin toplu ticari uygulamasını destekleyecek kadar gelişmiş olmadığından, 2006'da Geoffrey Hinton ve arkadaşlarının ufuk açıcı makaleleri olan “A Fast Learning Algorithm for Deep Belief” yayınladığı zamana kadar popülerlik kazanmadı. Ağlar.” 90'ların AI kışına ve 2000'lerin ilk yarısına rağmen, derin öğrenmenin üç akademik gurusu Geoffrey Hinton, Yann LeCun ve Yoshua Bengio dahil olmak üzere birkaç bilim adamı, akademik alanda derin öğrenme üzerinde çalışmaya devam ediyor. Bulut bilişim ve GPU'lar gibi bilgi işlem gücünün hızlı atılımı, dijital ekonomi aracılığıyla büyük verilerin kullanılabilirliği ile birleştiğinde, son on yılda derin öğrenme algoritmalarının uygulanmasını mümkün kılmıştır. Örneğin, Google'ın sürücüsüz otomobil araştırması 2009'da başladı.

Teknik olarak derin öğrenme, “bir makine öğrenimi algoritması sınıfı olarak tanımlanabilir:

özellik çıkarma ve dönüştürme için çok katmanlı doğrusal olmayan işlem birimlerini kullanın. Her ardışık katman, bir önceki katmanın çıktısını girdi olarak kullanır.
denetimli (örn. sınıflandırma) ve/veya denetimsiz (örn. örüntü analizi) yöntemlerle öğrenir.
farklı soyutlama seviyelerine karşılık gelen çoklu temsil seviyelerini öğrenir; düzeyler bir kavramlar hiyerarşisi oluşturur.”

Anahtar, geleneksel makine öğrenimine kıyasla "çoklu katmanlardır". Örneğin, bir kediyi bir köpekten nasıl ayırt edersiniz? Makine öğrenimini kullanacak olsaydınız, iki kulak, tüylü bir yüz, gözler ile burun ve ağız arasındaki mesafe gibi hem köpeklerde hem de kedilerde ortak olan birkaç özelliği çıkarabilirdiniz. Ve şöyle bir sonuç alabilirsiniz: resim %50 köpek, %50 kedi - pek kullanışlı değil. Bununla birlikte, derin öğrenmeyi kullanmak, bir kedinin bir köpeğe karşı ayırt edici özelliklerinin ne olduğunu bile bilmiyorsunuz, ancak makine, yeni özellikler ve yüzlerce (veya binlerce) istatistiksel model oluşturmanın birden çok katmanı aracılığıyla, daha fazlasını sağlayacaktır. doğru çıktı - örneğin %90 köpek, %10 kedi. Aşağıdaki iki çizelge, bir sinir ağının nasıl "öğrendiğini" ve klasik makine öğrenimi ile sinir ağları arasındaki farkı göstermektedir.

Bir sinir ağının nasıl öğrendiğini ve klasik makine öğrenimi ile sinir ağları arasındaki farkı gösteren grafikler.

Okuyucular, yukarıdakileri okuduktan sonra kafalarını kaşıyabilir ve haklı olarak. Ancak asıl amacımıza geri dönersek: Bir yatırımcının bakış açısından derin öğrenmeyi bu kadar özel yapan nedir? Bu soruya çeşitli karmaşık teknik açıklamalarla cevap verilebilir, ancak gerçekten basit bir şekilde ifade edersek, soldaki aşağıdaki grafik bunu gerçekten netleştirmek için harika bir iş çıkarıyor: derin öğrenme, diğer öğrenme algoritmalarından çok daha güçlü performans sağlar. Microsoft blogunda detaylandırıldığı şekliyle konuşma tanıma örneğini ele alalım (aşağıdaki tablo sağda): Orijinal 1988 konuşma tanıma hata oranı %60-70 iken, derin öğrenme kullanan yeni Microsoft sistemi 2014'te sadece %6,3'tü.

Derin öğrenme ve konuşma tanıma sözcük hata oranlarının tarihsel gelişimiyle ilgili verileri gösteren iki grafikli görüntü.

Başarılı AI uygulamalarının temel bileşenleri

Bir makine öğrenimi (derin öğrenme dahil) ürününün başarısının 4 temel bileşeni olduğuna inanıyorum: iyi tanımlanmış istenen problemler, veriler, algoritma(lar) ve bilgi işlem gücü .

Her şeyden önce, AI uygulamasının iyi tanımlanmış (spesifik) ve arzu edilen (acil ve net müşteri sıkıntı noktalarını hedefleyen) bir sorunu çözmesi gerekir . Bilgisayarın 3 farklı AI dalgası üzerinde oynaması öğretilen farklı oyunları düşünün: dama, satranç, Go. Bunlar çok iyi tanımlanmış problemlerdi ve bu nedenle bir bilgisayarın çözmesi daha kolaydı. Yüz tanıma, makine çevirisi, sürücüsüz arabalar, arama motoru optimizasyonu, hepsi iyi tanımlanmış arzu edilen problemlerdir. Bununla birlikte, iyi tanımlanmış arzu edilen sorunların olmaması, örneğin genel bir ev temizlik robotu üretmenin bu kadar zor olmasının nedenidir. Bardak toplamak ve çamaşırları sepete koymak gibi basit ev işleri çok fazla problem çözmeyi gerektirir. Örneğin, makinenin hangi nesnelerin alınması gerektiğini (bardaklar, kirli çamaşırlar ve temiz çamaşırlar değil, vb.), nereye gidileceğini ve oraya nasıl gidileceğini (evdeki engellerden kaçının ve istenen yere seyahat edin) belirlemesini gerektirir. konumu), her bir nesneyi, bardağı veya çamaşırları kırmaması için istenen güçte tutma vb.

İkincisi, bir makine öğrenimi algoritması geliştirmek , temiz ve iyi etiketlenmiş verilere erişim gerektirir. Bunun nedeni, bu algoritmaların, gerekli öngörücü ilişkileri kurmak için iyi etiketlenmiş büyük miktarda veriyi farklı istatistiksel modellerle besleyerek oluşturulmuş olmasıdır. Bu veri toplama çalışması, geliştirmekte olduğunuz ticari uygulamaya bağlı olarak zor veya kolay olabilir. Örneğin, şaraplık üzüm tarlaları için bilgisayarlı görü algoritması geliştirmek için gerekli verileri toplamak için girişimim, farklı lokasyonlardan farklı çeşitlerde ve daha zor, farklı mevsimlerde alan görüntülerine ihtiyaç duyuyordu. Her sezon bir yıl olduğu için tatmin edici ürünler elde etmek yıllar alacaktır. Buna karşılık, Çin'de iyi bir yüz tanıma algoritması geliştirmek, örneğin 10 milyon görüntü toplamak istiyorsanız, Pekin'de işlek bir caddede bir hafta boyunca bir kamera kurmanız ve görevi tamamlamanız yeterlidir. Başka bir örnek, kişisel haber tercihlerinizi öğrenen ve yalnızca sizinle en alakalı haberleri gösteren Çin'deki 1 numaralı yapay zeka destekli kişiselleştirilmiş haber toplayıcı Toutiao olabilir. Bu durumda veri toplamak yine çok daha kolaydır, örneğin her bir haber kategorisinde okuduğunuz makale sayısı, her bir makale için harcadığınız zaman vb.

Üçüncüsü, bir yapay zeka işinin sağlam ve ölçeklenebilir algoritmalar geliştirmesi gerekiyor. Bunu başarmak için olmazsa olmaz üç şey vardır: büyük miktarda iyi etiketlenmiş veri (yukarıda tartışıldığı gibi), doğru yetenek ve derin öğrenmenin sorunu çözmek için doğru teknoloji olduğuna dair güven. Yapay zeka işinin gerekli algoritmaları geliştirmek için doğru yeteneğe sahip olması gerekir, ancak bunlar son derece uzmanlaşmış, pahalı ve kıttır. Örneğin, girişimim için işe alım ararken, en azından algoritma prototipleri geliştirmek için veri bilimcilere (genellikle doktora), çerçeveler tasarlamak için mühendislere, kodlamak için programcılara (TensorFlow, Python, C++ vb.) ölçeklenebilir programlara ve bunları bir araya getirecek kişilere (ürün yöneticisi, UX, UI, vb.)

Diğer bir husus ise bilgi işlem gücüdür . Niye ya? Çünkü derin öğrenme sinir ağları, diğer AI yöntemlerinden çok daha fazla hesaplama gerektirir. Örneğin, bir görüntüdeki bir köpeği tanımlama görevi için, modeli derin olmayan öğrenme algoritması kullanarak eğitmek, örneğin 1 GB'lık bir veri kümesi verilen 10 istatistiksel modele ihtiyaç duyabilir. Derin sinir ağları modeli, örneğin 100 GB'lık bir veri kümesinde çalışan 1000 istatistiksel modele ihtiyaç duyabilir. Sonuçlar ağları kullanarak daha iyidir, ancak gereken hesaplama gücü çok daha fazladır. Sonuç olarak, bu modeller yalnızca bir bilgisayar (kişisel bilgisayarlarımızda yaptığımız gibi) değil, her bir GPU işlemesi ile dağıtılmış hesaplama, örneğin hesaplamanın %5'ini gerektirir, böylece 20 GPU birlikte gereken hesaplama hacmini işleyebilir. Bu da kendi GPU küme sunucularınızı oluşturmanız veya bilgi işlem gücünü AWS gibi platformlardan kiralamanız gerektiği anlamına gelir. Bulut bilişimden veya kendi sunucularınızdan gelen bilgi işlem gücü maliyetlidir, ancak adil olmak gerekirse bilgi işlemin birim maliyetinin sürekli olarak azalması gerekir (Moore yasasına göre).

Çözüm

Pek çok kişi, birçok endüstrinin ve tüketici internetinin dijitalleşmesi, büyük miktarda amaca uygun olarak toplanmış, temiz bir şekilde organize edilmiş dijital veriyi kullanıma sunduğundan, yapay zeka atılımlarını ve startup'ları görmenin en iyi zamanının şu an olduğuna inanıyor. Nvidia'nın GPU'sunun ve Intel'in FPGA'sının geliştirilmesi, gerekli hesaplamaları yapmayı çok daha ucuz ve hızlı hale getiriyor. Bu nedenle, mevcut AI yenilik dalgası, derin öğrenmedeki önemli ilerlemelerden kaynaklanmaktadır .

Ancak bir AI uygulamasının başarılı olması için, iyi tanımlanmış arzu edilen bir soruna, verilere, algoritmaya ve önemli bilgi işlem gücüne ihtiyaç vardır. İşlerini güçlendirmek için yapay zekayı kullanmayı düşünen bu makaleyi okuyan yöneticiler için yukarıda bahsedilen dört temel bileşen de geçerlidir.

AI hakkında nasıl daha fazla bilgi edinebilirsiniz? AI hakkında bilgi edinmek için çok sayıda kitap, seminer, Coursera kursu, araştırma makalesi ve Deep Learning gibi organizasyonlar var. Bu makalenin odak noktası, AI'nın temellerini bilmek isteyen yatırımcılar için olduğundan, AI'nın bir tehdit olarak potansiyeli, endüstrinin gelecekteki görünümü, AI yatırımları, profesyoneller gibi sıcak AI konularının çoğuna dokunmadım. ve farklı algoritmaların eksileri (örn. CNN), prototipleme ve ölçekleme, ana programlama dilleri vb. Bu serinin 2. Kısmında, AI şirketlerini yatırımcı bakış açısıyla nasıl değerlendireceğimi inceleyeceğim.