Pengembangan Proyek AI – Bagaimana Manajer Proyek Harus Mempersiapkan

Diterbitkan: 2022-03-11

Dengarkan versi audio dari artikel ini

Sebagai manajer proyek, Anda mungkin pernah terlibat dalam sejumlah proyek TI sepanjang karier Anda, mencakup struktur monolitik yang kompleks hingga aplikasi web SaaS. Namun, dengan kemajuan kecerdasan buatan dan pembelajaran mesin, proyek-proyek baru dengan persyaratan dan masalah yang berbeda muncul dengan cepat.

Dengan munculnya teknologi ini, menjadi kurang dari "menyenangkan untuk dimiliki" dan sebaliknya penting bagi manajer proyek teknis untuk memiliki hubungan yang sehat dengan konsep-konsep ini. Menurut Gartner, pada tahun 2020, AI akan menghasilkan 2,3 juta pekerjaan, melebihi 1,8 juta yang akan dihapus—menghasilkan nilai bisnis $2,9 triliun pada tahun 2021. CEO Google mengatakan bahwa “AI adalah salah satu hal terpenting kemanusiaan sedang bekerja. Itu lebih dalam dari […] listrik atau api.”

Dengan aplikasi kecerdasan buatan yang telah mengganggu industri mulai dari keuangan hingga perawatan kesehatan, PM teknis yang dapat menangkap peluang ini harus memahami bagaimana manajemen proyek AI berbeda dan bagaimana mereka dapat mempersiapkan diri dengan baik untuk lanskap yang berubah.

Teori

Apa Artinya: AI vs. ML

Sebelum masuk lebih dalam, penting untuk memiliki pemahaman yang kuat tentang apa sebenarnya AI itu. Dengan banyak istilah berbeda yang sering digunakan secara bergantian, mari selami definisi yang paling umum terlebih dahulu.

Perkembangan AI, pembelajaran mesin, dan pembelajaran mendalam

Perkembangan AI, pembelajaran mesin, dan pembelajaran mendalam

Kecerdasan Buatan (AI)

AI adalah bidang ilmu komputer yang didedikasikan untuk memecahkan masalah yang membutuhkan kecerdasan manusia—misalnya, pengenalan pola, pembelajaran, dan generalisasi.

Istilah ini telah digunakan secara berlebihan dalam beberapa tahun terakhir untuk menunjukkan kecerdasan umum buatan (AGI) yang mengacu pada program komputer yang sadar diri, mampu kognisi nyata. Namun demikian, sebagian besar sistem AI di masa mendatang akan menjadi apa yang oleh para ilmuwan komputer disebut "AI sempit", yang berarti bahwa mereka akan dirancang untuk melakukan satu tugas kognisi dengan sangat baik, daripada benar-benar "berpikir" untuk diri mereka sendiri.

Pembelajaran Mesin (ML)

Pembelajaran mesin adalah bagian dari kecerdasan buatan yang menggunakan teknik statistik untuk memberi komputer kemampuan belajar dari data tanpa diprogram secara eksplisit.

AI dan ML telah digunakan secara bergantian oleh banyak perusahaan dalam beberapa tahun terakhir karena keberhasilan beberapa metode pembelajaran mesin di bidang AI. Untuk lebih jelasnya, pembelajaran mesin menunjukkan kemampuan program untuk belajar , sementara kecerdasan buatan mencakup pembelajaran bersama dengan fungsi lainnya.

Untuk mempelajari lebih lanjut tentang jaringan saraf dan pembelajaran mendalam, silakan merujuk ke lampiran di akhir artikel ini.

Perbedaan Penting: AI vs. Algoritma Standar

Kunci utama AI adalah bahwa algoritmenya menggunakan sejumlah besar data untuk menyesuaikan struktur internalnya sehingga, ketika data baru disajikan, ia akan dikategorikan sesuai dengan data sebelumnya yang diberikan. Kami menyebutnya "belajar" dari data daripada beroperasi sesuai dengan instruksi kategorisasi yang ditulis secara ketat dalam kode.

Bayangkan kita ingin menulis sebuah program yang dapat membedakan mobil dari truk. Dalam pendekatan pemrograman tradisional, kami akan mencoba dan menulis program yang mencari fitur indikatif spesifik, seperti roda yang lebih besar atau bodi yang lebih panjang. Kita harus menulis kode yang secara khusus mendefinisikan bagaimana fitur-fitur ini terlihat dan di mana mereka harus ditemukan dalam sebuah foto. Untuk menulis program seperti itu dan membuatnya bekerja dengan andal sangat sulit, kemungkinan menghasilkan positif palsu dan negatif palsu, ke titik di mana pada akhirnya mungkin tidak dapat digunakan sama sekali.

Di sinilah algoritma AI menjadi sangat berguna. Setelah algoritme AI dilatih, kami dapat menunjukkan banyak contoh, dan itu menyesuaikan struktur internalnya untuk mulai mendeteksi fitur yang relevan dengan klasifikasi gambar yang berhasil alih-alih mengandalkan definisi fitur statis yang ditentukan.

Manajemen Proyek AI dalam Praktek

Data Adalah Raja

Manusia tidak pandai menangani volume data yang besar, dan volume data yang tersedia untuk kita terkadang menghalangi kita untuk menggunakannya secara langsung. Di sinilah sistem AI masuk.

Konsep inti tentang sistem AI adalah bahwa prediksi mereka hanya sebaik data mereka. Misalnya, algoritma dengan satu juta titik data akan mengungguli algoritma yang sama dengan 10.000 titik data. Selain itu, BCG melaporkan bahwa “banyak perusahaan tidak memahami pentingnya data dan pelatihan untuk kesuksesan AI. Seringkali, data yang lebih baik lebih penting untuk membangun sistem yang cerdas daripada algoritma yang lebih baik, seperti halnya pengasuhan sering kali lebih penting daripada alam pada manusia.”

Dengan pengetahuan ini, menyiapkan dan membersihkan data adalah sesuatu yang akan menjadi lebih umum dalam proses proyek. Langkah ini seringkali merupakan bagian paling padat karya dalam membangun sistem AI, karena sebagian besar bisnis tidak memiliki data yang siap dalam format yang benar—sehingga, analis data mungkin perlu beberapa saat untuk menyelesaikan langkah penting ini.

Persiapan data adalah langkah kunci dalam manajemen proyek AI.

Persiapan data adalah langkah kunci dalam manajemen proyek AI.

Selain itu, pekerjaan penyiapan infrastruktur data dan pembersihan data jauh lebih linier daripada pengembangan perangkat lunak biasa dan mungkin memerlukan metodologi manajemen proyek yang berbeda.

Singkatnya, perlu waktu lebih lama untuk membangun infrastruktur data yang tepat dan menyiapkan data yang akan digunakan daripada membangun model pembelajaran mesin untuk menjalankan data. Ini adalah pertimbangan besar bagi manajer proyek karena mereka mengelola tim dan memikirkan cakupan AI dan perkiraan proyek.

Selain itu, dataset harus terus diperbarui dengan data baru. Akses ke kumpulan data unik mungkin menjadi faktor penentu utama yang menentukan produk ML mana yang paling berhasil. Sangat penting untuk selalu mengetahui hal ini untuk mencapai kinerja terbaik untuk proyek ML Anda, bahkan setelah peluncuran.

Siklus Hidup Pengembangan AI

Sebagian besar dari Anda akan terbiasa dengan siklus hidup pengembangan sistem standar (SDLC) bersama dengan bagaimana berbagai metodologi dan teknologi membentuknya. Penting untuk dicatat bahwa pengembangan AI akan membawa serangkaian tantangan baru ke lapangan. Kami dapat membagi siklus pengembangan AI menjadi langkah-langkah berikut: pembuatan ide dan penemuan data, memprioritaskan MVP, dan mengembangkan MVP menjadi produk yang lengkap.

Ide dan Penemuan Data

Pada tahap pertama ini, fokusnya harus pada dua hal utama: pengguna akhir produk ML dan kumpulan data mana yang tersedia.

Dengan mendekati masalah dari dua sisi independen, teknik ini dapat membantu manajer proyek dengan cepat mempersempit peluang produk ML yang tersedia dalam perusahaan. Selama fase ini, PM teratas dapat mengambil manfaat dari pengetahuan mereka tentang ruang pembelajaran mesin untuk lebih memahami kesulitan dalam memecahkan masalah tertentu. Hal-hal bergerak sangat cepat di bidang ML, dan beberapa masalah sulit dapat dibuat lebih mudah dengan perkembangan baru dalam penelitian.

Seperti disebutkan sebelumnya, setelah data ditemukan, perlu dibersihkan dan disiapkan. Tugas khusus ini biasanya dilakukan dalam langkah-langkah linier, yang tidak sesuai dengan metodologi proyek yang khas seperti Agile atau Waterfall, meskipun mereka dapat dipaksakan menjadi sprint. Biasanya, pembersihan data dilakukan secara iteratif dengan meningkatkan ukuran kumpulan data secara bertahap dan mempersiapkannya secara paralel dengan upaya pengembangan lainnya.

Memprioritaskan Minimum Viable Product (MVP)

Kebenaran bahwa lebih baik memiliki prototipe kerja dari produk yang lebih kecil, daripada yang besar yang belum selesai, masih berdiri di sini dengan produk pembelajaran mesin. MVP ML ​​baru harus diprioritaskan berdasarkan kecepatan pengiriman dan nilainya bagi perusahaan. Jika Anda dapat mengirimkan produk, bahkan yang mungkin lebih kecil, dengan cepat, itu bisa menjadi kemenangan cepat yang baik untuk seluruh tim—Anda harus memprioritaskan produk ini terlebih dahulu.

Mempersiapkan MVP ini dengan gaya Agile klasik adalah ide yang bagus, dan tim pengembangan harus fokus pada pengiriman model ML berdasarkan kumpulan data yang terus ditingkatkan yang disiapkan secara independen oleh tim data. Perbedaan penting di sini adalah bahwa tim data tidak perlu bekerja melalui struktur Sprint yang sama dengan tim yang membangun MVP .

MVP ke Produk Lengkap

Langkah ini adalah di mana infrastruktur data menjadi kunci. Jika produk ML Anda memerlukan akses API frekuensi tinggi dari seluruh dunia, maka Anda sekarang harus mempertimbangkan bagaimana Anda dapat meningkatkan skala infrastruktur untuk mendukung produk ML.

Di sinilah perubahan pada modul ML harus dievaluasi dengan cermat agar tidak merusak kinerja produk saat ini. Melatih ulang modul ML dengan algoritme atau set data baru tidak selalu menghasilkan peningkatan kinerja linier—oleh karena itu, sejumlah besar pengujian diperlukan sebelum penerapan langsung. Pengujian modul ML untuk kasus edge dan potensi serangan generative adversarial network (GAN) masih dalam tahap awal, tetapi ini pasti sesuatu yang harus diingat oleh manajer proyek saat menjalankan produk ML langsung.

Peran Kunci Dalam Siklus Hidup Pengembangan AI

Persyaratan data-berat untuk mengembangkan aplikasi ML membawa peran baru ke dalam SDLC produk AI. Untuk menjadi manajer proyek yang hebat di bidang aplikasi ML, Anda harus sangat memahami tiga peran berikut: ilmuwan data, insinyur data, dan insinyur infrastruktur. Meskipun terkadang mereka menyamar dengan judul lain, termasuk insinyur pembelajaran mesin, insinyur infrastruktur pembelajaran mesin, atau ilmuwan pembelajaran mesin, penting untuk memiliki pemahaman yang kuat tentang posisi inti ini dan dampaknya pada proses pengembangan ML.

Tiga peran utama yang harus dipahami oleh PM teknis: ilmuwan data, insinyur data, dan insinyur infrastruktur

Tiga peran utama yang harus dipahami oleh PM teknis: ilmuwan data, insinyur data, dan insinyur infrastruktur

Ilmuwan Data

Ilmuwan data adalah individu yang membangun model pembelajaran mesin. Mereka mensintesis ide berdasarkan pemahaman mendalam mereka tentang statistik terapan, pembelajaran mesin, dan analitik, lalu menerapkan wawasan mereka untuk memecahkan masalah bisnis nyata.

Ilmuwan data terkadang dilihat sebagai versi lanjutan dari analis data. Namun, ilmuwan data biasanya memiliki keterampilan pemrograman yang kuat, nyaman memproses data dalam jumlah besar yang tersebar di seluruh pusat data, dan memiliki keahlian dalam pembelajaran mesin.

Mereka juga diharapkan memiliki pemahaman yang baik tentang infrastruktur data dan penambangan data besar serta dapat melakukan latihan eksplorasi sendiri, melihat data dan menemukan untuk menemukan petunjuk dan wawasan awal di dalamnya.

Keterampilan Dasar: Python, R, Scala, Apache Spark, Hadoop, Pembelajaran Mesin, Pembelajaran Mendalam, Statistik, Ilmu Data, Jupyter, RStudio

Insinyur Data

Insinyur data adalah insinyur perangkat lunak yang berspesialisasi dalam membangun perangkat lunak dan infrastruktur yang diperlukan agar produk ML dapat beroperasi. Mereka cenderung fokus pada arsitektur menyeluruh dan, meskipun mereka mungkin bukan ahli dalam pembelajaran mesin, analitik, atau data besar, mereka harus memiliki pemahaman yang baik tentang topik ini untuk menguji perangkat lunak dan infrastruktur mereka. Ini diperlukan agar model pembelajaran mesin yang dibuat oleh ilmuwan data berhasil diimplementasikan dan diekspos ke dunia nyata.

Keterampilan Dasar: Python, Hadoop, MapReduce, Hive, Pig, Streaming Data, NoSQL, SQL, Pemrograman, DashDB, MySQL, MongoDB, Cassandra

Insinyur Infrastruktur

Insinyur infrastruktur menangani tulang punggung produk ML: lapisan infrastruktur. Sementara insinyur data mungkin membangun beberapa infrastruktur ini, seringkali dibangun di atas lapisan yang disiapkan dan disetujui oleh tim infrastruktur.

Insinyur infrastruktur dapat bekerja di beberapa tim ML, dengan tujuan menciptakan lingkungan yang skalabel dan efisien di mana aplikasi ML dapat diskalakan untuk melayani jutaan pengguna. Insinyur infrastruktur tidak hanya menangani tingkat platform perangkat lunak tetapi juga berkoordinasi dengan mitra pusat data untuk memastikan bahwa semuanya berjalan lancar, mulai dari lokasi geografis data yang dihosting hingga perangkat keras. Dengan semakin pentingnya aspek-aspek ini untuk proyek ML, insinyur infrastruktur menjadi semakin penting di perusahaan yang digerakkan oleh AI.

Keterampilan Dasar: Kubernetes, Mesos, EKS, GKE, Hadoop, Spark, HDFS, CEPH, AWS, Cloud Computing, Operasi Pusat Data, Infrastruktur Komputasi ujung ke ujung, Infrastruktur TI, Manajemen Layanan

Tantangan Umum Hari Ini

Dengan munculnya produk berbasis AI dan ML, manajer proyek diharapkan menghadapi tantangan yang sudah dikenal dan sepenuhnya asing. PM top sangat menyadari potensi masalah ini melalui keseluruhan proses, mulai dari scoping out proyek hingga penyelesaian.

Pengecekan kenyataan

Terlepas dari popularitas dan janji AI, ada kemungkinan besar bahwa masalah yang Anda coba selesaikan tidak memerlukan solusi AI yang rumit .

Banyak masalah prediksi dapat diselesaikan dengan menggunakan model regresi statistik yang lebih sederhana dan, dalam beberapa kasus, lebih dapat diandalkan. Sangat penting bagi seorang PM untuk melakukan pemeriksaan kewarasan sebelum memulai proyek untuk memastikan masalah tersebut benar-benar membutuhkan pembelajaran mesin.

Terkadang bijaksana untuk memulai dengan model statistik yang lebih sederhana dan bergerak secara paralel dengan solusi berbasis pembelajaran mesin. Misalnya, jika Anda sedang membuat mesin rekomendasi, sebaiknya mulai dengan solusi yang lebih sederhana dengan siklus hidup pengembangan yang lebih cepat, yang memberikan dasar yang baik bahwa model ML berikutnya harus berperforma lebih baik.

AI Lingkup Creep

Penyebab paling umum dari scope creep dalam proyek ML terkait dengan mencoba melakukan terlalu banyak hal sekaligus dan meremehkan upaya yang diperlukan untuk menyiapkan data .

Untuk mengatasi masalah pertama, kelola pemangku kepentingan sehingga mereka mengerti bahwa lebih baik memulai dengan kemenangan cepat daripada rencana muluk. Komunikasikan pendekatan ini secara terus menerus sepanjang proyek, saat Anda membangun dan menguji.

Mulailah dengan fitur atom kecil yang dapat dengan mudah ditentukan dan diuji. Jika Anda menemukan diri Anda dengan tugas yang kompleks, cobalah untuk memecahnya menjadi tugas-tugas sederhana yang merupakan proxy yang baik untuk tugas utama Anda. Seharusnya mudah untuk mengomunikasikan apa yang ingin dicapai oleh tugas-tugas ini.

Misalnya, jika Anda mencoba memprediksi kapan pengguna akan mengklik iklan tertentu, Anda dapat mencoba memprediksi terlebih dahulu apakah pengguna akan menutup iklan sepenuhnya. Dalam pendekatan ini, masalahnya disederhanakan dan dapat diakomodasi dan diprediksi dengan lebih baik oleh model ML saat ini. Facebook telah membuat seri hebat yang membahas topik ini lebih dalam, lebih fokus pada saluran ML dari awal hingga pengiriman model.

Untuk mengatasi kontributor kedua untuk scope creep, pastikan Anda mampu menyiapkan data untuk mendukung proyek ML Anda. Dengan asumsi Anda memiliki data yang dibutuhkan, dalam format yang dibutuhkan, adalah kesalahan paling umum yang dilakukan PM saat baru memulai proyek ML. Dengan persiapan dan pembersihan data yang sering menjadi bagian yang lebih panjang dari proses proyek ML, mengelola langkah ini sangat penting. Pastikan ilmuwan data Anda memiliki akses ke data yang benar dan dapat memeriksa kualitas dan validitasnya sebelum membuat fitur ML yang ingin mereka buat.

Bersiaplah untuk melakukan pelabelan dan pembersihan data sebagai latihan berkelanjutan di seluruh proyek, bukan hanya sebagai pemrakarsa, karena proyek selalu dapat memperoleh manfaat dari data yang lebih baik dan lebih banyak. Karena langkah ini bukan tugas yang paling menarik, bagi pekerjaan ini menjadi beberapa sprint sehingga tim data Anda dapat merasakan kemajuan upaya mereka alih-alih menghadapi tumpukan tiket yang tak ada habisnya.

Terkadang, perusahaan mengalihdayakan pelabelan data ke pihak ketiga. Meskipun hal ini dapat membantu menghemat waktu dan biaya di muka, hal ini juga dapat menghasilkan data yang tidak dapat diandalkan, yang pada akhirnya menghambat keberhasilan model ML Anda. Untuk menghindarinya, gunakan teknik multiple overlap, di mana setiap bagian data diperiksa oleh banyak pihak dan hanya digunakan jika hasilnya cocok.

Saat merencanakan proyek, berikan waktu yang cukup bagi tim data untuk melakukan penyesuaian jika persyaratan pelabelan Anda berubah di tengah proyek dan pelabelan ulang diperlukan.

Terakhir, periksa apakah data Anda dapat dengan mudah digunakan dengan metode ML yang ada daripada menciptakan metode ML baru, karena mulai dari nol dapat meningkatkan waktu dan cakupan proyek secara drastis. Perhatikan bahwa jika Anda mencoba memecahkan masalah ML yang belum terpecahkan, ada kemungkinan besar Anda akan gagal. Terlepas dari keberhasilan pembelajaran mesin dan jumlah makalah penelitian yang diterbitkan, memecahkan masalah ML bisa menjadi usaha yang sangat sulit. Itu selalu paling mudah untuk memulai dengan area ML yang memiliki banyak contoh dan algoritme bagus dan mencoba memperbaikinya daripada mencoba menciptakan sesuatu yang baru.

Pembelajaran Mesin, Harapan, dan UX

Setiap PM harus siap untuk memikirkan pengalaman pengguna dari produk AI yang mereka buat dan cara terbaik untuk mengelola tim yang membangunnya. Google menulis artikel hebat tentang cara berpikir mereka tentang UX dan AI, dengan penekanan pada interaksi manusia.

Poin ini sangat penting jika produk ML Anda harus berinteraksi dengan operator atau bahkan digantikan oleh mereka. Desain harus menambahkan jumlah tekanan minimum yang diperlukan untuk operator dan pengguna sistem. Misalnya, chatbots sering didasarkan pada pembelajaran mesin, tetapi mereka dapat dengan mudah diambil alih oleh operator manusia.

Ada juga kemungkinan bahwa pemangku kepentingan dapat mengharapkan lebih banyak dari produk pembelajaran mesin daripada yang dapat mereka berikan. Ini biasanya masalah yang berasal dari hype yang dibuat oleh media saat menulis tentang produk AI, dan oleh karena itu, penting bagi manajer proyek untuk menetapkan ekspektasi yang masuk akal.

Pastikan untuk menjelaskan apa sebenarnya alat AI dan dapat dicapai untuk pemangku kepentingan Anda sehingga Anda dapat mengelola harapan mereka dengan cukup baik sebelum mereka menguji alat tersebut. UX yang baik memang hebat, tetapi tidak dapat memberikan nilai kepada pengguna dengan harapan yang tidak realistis, jadi penting bagi setiap PM yang terlibat untuk mengelola ini dan mendidik pemangku kepentingan mereka tentang AI dan kemampuannya yang realistis.

Jaminan Kualitas (QA) dan Praktik Pengujian di ML

AI dalam bentuknya saat ini adalah bidang yang relatif baru. Belum pernah ada begitu banyak aplikasi yang menggunakan pembelajaran mendalam untuk mencapai tujuannya. Perkembangan baru ini datang dengan serangkaian tantangannya sendiri, terutama dalam pengujian.

Meskipun relatif mudah untuk menguji perangkat lunak standar yang memiliki "set aturan" yang jelas yang ditulis oleh orang-orang, jauh lebih sulit untuk menguji model pembelajaran mesin secara mendalam, terutama yang dibangun menggunakan jaringan saraf. Saat ini, sebagian besar model ML diuji oleh ilmuwan data itu sendiri, namun ada beberapa metode pengujian yang disepakati dengan tim QA standar untuk memastikan bahwa produk ML tidak gagal dengan cara yang tidak terduga.

Dengan cara baru untuk memanipulasi hasil model yang dikenal seperti serangan GAN ini, pengujian model yang komprehensif akan menjadi semakin penting. Ini akan menjadi prioritas untuk banyak proyek ML, dan kita akan melihat lebih banyak pengujian jenis "integrasi" untuk model ML di tahun-tahun mendatang. Untuk sebagian besar proyek sederhana, saat ini mungkin bukan masalah nyata, tetapi penting untuk mengingat hal ini jika Anda sedang membangun produk ML yang sangat penting.

Pencurian Model ML dan Plagiarisme

Sejak artikel Wired ini diterbitkan, dan makalah asli dipresentasikan pada konferensi Keamanan USENIX pada tahun 2016, menjadi jelas bahwa ada kemungkinan untuk menjiplak model ML langsung.

Ini masih cukup sulit untuk diselesaikan dengan baik, tetapi jika Anda memiliki model yang berjalan melalui API yang tersedia untuk umum, penting untuk menyadari kemungkinan ini. Secara teori, pihak dengan akses substansial ke sana dapat melatih jaringan mereka sendiri berdasarkan jaringan Anda dan secara efektif menyalin kemampuan prediksi Anda.

Ini masih sangat terbatas dalam hal kemungkinan, tetapi pastikan untuk bekerja dengan tim Anda dalam strategi pencegahan untuk kemungkinan serangan jika ini menjadi masalah untuk proyek Anda.

Kekurangan Bakat

Dengan permintaan ahli AI kelas dunia saat ini, persaingan untuk mendapatkan talenta yang tepat sangat ketat. Faktanya, New York Times melaporkan bahwa pakar AI kelas dunia dapat menghasilkan hingga $ 1 juta per tahun dengan bekerja untuk pembangkit tenaga listrik besar di Silicon Valley. Sebagai PM, saat Anda mencari pakar AI untuk bergabung dengan tim Anda, perhatikan dinamika ini karena dapat memengaruhi siklus perekrutan, anggaran, atau kualitas pekerjaan Anda.

Kekurangan ini melampaui pemikiran inovatif yang menciptakan algoritme pembelajaran mendalam yang lebih baru dan juga berlaku untuk insinyur dan ilmuwan data berkualitas tinggi.

Banyak orang paling berbakat berpartisipasi dalam kompetisi pembelajaran mesin seperti Kaggle di mana mereka dapat berharap untuk memenangkan $ 100.000 untuk memecahkan masalah pembelajaran mesin yang sulit. Jika sulit untuk merekrut pakar ML secara lokal, adalah bijaksana untuk mencari solusi luar biasa, seperti menyewa kontraktor khusus dari jarak jauh atau menjalankan kompetisi Kaggle Anda sendiri untuk masalah ML yang paling sulit.

Tantangan Hukum dan Etika

Tantangan hukum dan etika AI dalam manajemen proyek ada dua.

Serangkaian tantangan pertama berasal dari data yang digunakan untuk melatih model ML. Sangat penting untuk memahami dari mana data yang Anda gunakan berasal, dan khususnya apakah Anda memiliki hak untuk menggunakannya dan lisensi yang memungkinkan Anda untuk menggunakan data tersebut.

Itu selalu penting untuk berkonsultasi dengan pengacara Anda untuk memecahkan pertanyaan tersebut sebelum menggunakan model yang terlatih pada data yang Anda mungkin tidak memiliki jenis lisensi yang tepat. Karena ini adalah bidang yang relatif baru, banyak dari jawaban ini tidak jelas, tetapi PM harus memastikan bahwa tim mereka hanya menggunakan kumpulan data yang berhak mereka gunakan.

Berikut adalah daftar kumpulan data yang tersedia untuk umum untuk melatih algoritme ML Anda.

Serangkaian tantangan kedua datang dari memastikan bahwa sistem Anda tidak mengembangkan bias sistematis. Ada banyak kasus masalah seperti itu dalam beberapa tahun terakhir, di mana satu perusahaan kamera harus mengakui bahwa teknologi pengenalan senyumnya hanya mendeteksi orang dari ras tertentu karena hanya dilatih pada data yang berisi wajah dari ras itu. Contoh lain datang dari perusahaan perangkat lunak besar, yang harus menarik bot Twitter belajar mandiri mereka setelah beberapa hari belajar, karena upaya bersama oleh sekelompok troll internet membuatnya menghasilkan penghinaan rasial dan konspirasi liar yang berulang.

Tingkat masalah ini bisa kecil atau menghancurkan proyek, jadi ketika mengembangkan sistem yang kritis, PM harus memastikan bahwa mereka mempertimbangkan kemungkinan tersebut dan mencegahnya sedini mungkin.

Fondasi yang Baik Menghasilkan Struktur yang Kuat

Kemajuan manajemen informasi, mengarah ke AI.

Kemajuan manajemen informasi, mengarah ke AI.

Singkatnya, revolusi AI yang akan datang menghadirkan serangkaian proyek dinamis yang menarik yang sering kali disertai dengan proses pengembangan yang dimodifikasi, pola dasar tim yang berbeda, dan tantangan baru.

Manajer proyek teknis teratas tidak hanya memiliki pemahaman yang baik tentang dasar-dasar AI tetapi juga intuisi untuk kesulitan setiap langkah proyek dan apa yang benar-benar mungkin untuk dibuat dengan tim mereka. Karena AI bukan solusi komersial siap pakai (COTS), bahkan perusahaan yang memilih untuk membeli produk ML tertentu masih harus berinvestasi dalam menguji hal-hal baru dan mengelola data dan infrastruktur mereka dengan benar.

Jelas bahwa jenis produk perangkat lunak dan proses pembuatannya berubah dengan munculnya AI. Manajer proyek yang mampu memahami dan menjalankan konsep baru ini akan menjadi pemain penting dalam menciptakan produk pembelajaran mesin masa depan.

Bahan Tambahan dari Penulis

Teori Tambahan: DL dan NN

Selain kata-kata yang lebih umum dari kecerdasan buatan (AI) dan pembelajaran mesin (ML), manajer proyek dapat mengambil manfaat dari menyadari lebih lanjut membedakan deep learning (DL) dan jaringan saraf (NN).

Pembelajaran Mendalam (DL)

Pembelajaran mendalam adalah bagian dari keluarga yang lebih luas dari metode pembelajaran mesin berdasarkan representasi data pembelajaran, yang bertentangan dengan algoritme khusus tugas klasik.

Sebagian besar model pembelajaran mendalam modern didasarkan pada jaringan saraf tiruan, meskipun mereka dapat menggunakan berbagai metode lain.

Jaringan Syaraf Tiruan (NN)

Neural network terinspirasi secara biologis, struktur matematis terhubung yang memungkinkan sistem AI untuk belajar dari data yang disajikan kepada mereka.

Kita dapat membayangkan jaringan ini sebagai jutaan gerbang kecil yang terbuka atau tertutup, tergantung pada input data kita. Keberhasilan teknik ini dimungkinkan oleh pertumbuhan kekuatan komputasi GPU dalam beberapa tahun terakhir, memungkinkan kami untuk dengan cepat menyesuaikan lebih banyak "gerbang kecil" di dalam jaringan saraf.

Diagram jaringan saraf

Diagram jaringan saraf

Ada beberapa jenis jaringan saraf, masing-masing disertai dengan kasus penggunaan khusus dan tingkat kerumitannya sendiri. Anda mungkin melihat istilah seperti CNN (convolutional neural network) atau RNN (recurrent neural network) yang digunakan untuk menjelaskan berbagai jenis arsitektur jaringan saraf.

Untuk lebih memahami bagaimana mereka terlihat dan berfungsi, berikut adalah visualisasi 3D yang bagus tentang bagaimana jaringan saraf "terlihat" saat mereka aktif.

Tertarik untuk Mempelajari Lebih Banyak tentang AI?

Jika, setelah membaca ini, Anda ingin pergi dan menjelajahi subjek sedikit lebih dalam, saya sarankan untuk memeriksa sumber-sumber ini:

Memahami Jaringan Syaraf

Jika Anda ingin menyelami lebih dalam mekanisme cara kerja jaringan saraf, saya sarankan Anda melihat seri 3Blue1Brown di jaringan saraf di YouTube. Menurut pendapat saya, ini adalah penjelasan mendalam terbaik tentang jaringan saraf. Hal ini disampaikan dalam istilah sederhana dan tidak memerlukan pengetahuan sebelumnya.

Tetap Terkini dengan Berita AI

Jika Anda ingin tetap up to date dengan kemajuan terbaru dalam teknologi AI tanpa menghabiskan berjam-jam membaca makalah akademis, saya merekomendasikan Makalah Dua Menit berikut. Saluran ini menyediakan pembaruan mingguan dua menit tentang teknik AI baru yang paling mengesankan dan implementasinya.

Mempelajari Dasar-dasar Pengembangan ML

Jika Anda ingin mencoba-coba kode sendiri, dan Anda memiliki beberapa keterampilan Python dasar, maka Anda dapat memeriksa Fast.ai. Kursus mereka memungkinkan siapa saja dengan keterampilan pengembangan dasar untuk mulai bereksperimen dan bermain-main dengan jaringan saraf.

Dasar-dasar Pembelajaran Mesin

Saran ini untuk mereka yang ingin memulai dari awal dan berusaha keras untuk memahami dan menerapkan pembelajaran mesin.

Dibuat oleh Andrew Ng yang sekarang legendaris, yang meluncurkan Coursera dengan kursus ini, kursus ini memang membutuhkan investasi waktu yang besar—setidaknya enam bulan—tetapi ini bisa menjadi cara yang sangat produktif untuk menghabiskan hari Sabtu.


Catatan: Definisi istilah kunci telah diadaptasi dari Wikipedia.