Büyük Veri ve Makine Öğrenimi Kansere Karşı Nasıl Birleşiyor?

Yayınlanan: 2018-01-09

Kanser tek bir hastalık değildir. Birçok hastalıktır. Basit bir örnekle kanserin nedenini anlayalım. Bir belgenin fotokopisini çekerseniz, bazı sorunlar nedeniyle orijinal nüshada olmasa da üzerinde başka noktalar veya lekeler beliriyor. Aynı şekilde gen replikasyon süreçlerinde de yanlışlıkla hatalar meydana gelmektedir. Hatalı genler çoğu zaman varlığını sürdüremeyecek ve sonunda yok olacaktır.

Bazı nadir durumlarda, mutasyona uğramış gen hataları ile hayatta kalır ve kontrolsüz bir şekilde daha fazla kopyalanır. Mutasyona uğramış genlerin kontrol edilemeyen replikasyonu, kanserin birincil nedenidir. Bu mutasyon vücudumuzdaki yirmi bin genin herhangi birinde olabilir. Herhangi bir veya bir gen kombinasyonundaki varyasyon, kanseri fethedilmesi gereken ciddi bir hastalık haline getirir. Kanseri yok etmek için, vücudun işlevsel hücrelerine zarar vermeden sahte hücreleri yok edecek yöntemlere ihtiyacımız var; bu da yenmeyi iki kat zorlaştırıyor.

İçindekiler

Kanser ve karmaşıklığı

Kanser, uzun kuyruk dağılımına sahip bir hastalıktır. Uzun kuyruk dağılımı, bu durumun ortaya çıkmasının çeşitli nedenleri olduğu ve onu ortadan kaldırmak için tek bir çözüm olmadığı anlamına gelir. Nüfusun büyük bir yüzdesini etkileyen ancak tek bir oluşum nedeni olan hastalıklar vardır. Örneğin, Kolera'yı ele alalım. Vibrio Cholerae bakterisiyle kontamine olmuş yiyecek veya içme suyu yemek, kolera nedenidir. Kolera sadece Vibrio Kolera nedeniyle ortaya çıkabilir ve başka bir sebep yoktur. Bir hastalığın tek sebebini bulduktan sonra, onu yenmek nispeten kolaydır.

Büyük Veri ve Makine Öğrenimi Kansere Karşı Birleşti UpGrad Blog
Bir durum birden çok nedenden dolayı ortaya çıkarsa ne olur? Vücudumuzdaki yirmi bin genin herhangi birinde mutasyon meydana gelebilir. Sadece bu değil, onların kombinasyonlarını da dikkate almamız gerekiyor. Kanser sadece bir gendeki rastgele bir mutasyon nedeniyle değil, aynı zamanda gen mutasyonlarının bir kombinasyonu nedeniyle de olabilir. Kanserin nedenlerinin sayısı katlanarak artıyor ve onu tedavi edecek tek bir mekanizma yok. Örneğin, ALK, BRAF, DDR2, EGFR, ERBB2, KRAS, MAP2K1, NRAS, PIK3CA, PTEN, RET ve RIT1 genlerinden herhangi birinin mutasyonu akciğer kanserine neden olabilir. Kanserin ortaya çıkmasının birçok yolu vardır ve bu yüzden uzun kuyruk dağılımına sahip bir hastalıktır.

Kansere karşı bu savaşı yürütmek ve onu yenmek için cephaneliğimizde büyük veri ve makine öğrenimi kritik araçlardır. Büyük veri bu savaşta nasıl yardımcı olabilir? Makine öğreniminin kanserle ne ilgisi var? Pek çok nedeni olan bir hastalıkla, uzun kuyruk dağılımı olan bir durumla savaşmada nasıl yardımcı olacaklar? Öncelikle bu büyük veri nasıl ve nerede üretiliyor? Gelin bu soruların cevaplarını bulalım.

Veride Gen Dizileme ve patlama

Gen dizilimi, muazzam miktarda veri üreten bir alandır. Tam olarak ne kadar veri? Washington Post'a göre , gen dizilimi yoluyla oluşturulan insan verileri (yaklaşık 2.5 lakh dizilim), YouTube'un yıllık veri üretiminin yaklaşık dörtte birini kaplıyor. Tüm bu veriler, dizileme genomlarıyla gelen tüm ekstra bilgilerle birleştirilip 4GB DVD'lere kaydedilseydi, yaklaşık yarım mil yüksekliğinde bir yığın olurdu.

Gen dizileme yöntemleri yıllar içinde gelişti ve bunun maliyeti katlanarak düştü. 2008 yılında gen dizileme maliyeti 10 milyon dolardı. Bugün itibariyle, sadece 1000 dolar. Gelecekte, daha da azalması bekleniyor. 2025 yılına kadar bir milyar insanın genlerinin dizilimi olacağı tahmin ediliyor. Dolayısıyla, önümüzdeki on yıl içinde, üretilen genomik veriler yılda 2 ila 40 eksabayt arasında bir yerde olacak. Bir exabayt on, ardından 17 sıfırdır.

Verilerin kanseri iyileştirmede nasıl yardımcı olacağına gelmeden önce, somut bir örnek alalım ve verilerin bir hastalığı yenmede nasıl yardımcı olabileceğini görelim. Veriler ve analizleri, bir bulaşıcı hastalığın nedenini bulmaya ve onunla savaşmaya yardımcı oldu, şimdi değil, on dokuzuncu yüzyılın kendisinde! Evet, on dokuzuncu yüzyılda! Bu hastalığın adı Kolera'dır.

Ondokuzuncu Yüzyılda Kümelenme – Kolera atılımı

John Snow bir anestezi uzmanıydı ve Eylül 1854'te Snow'un evinin yakınında kolera patlak verdi. Kar, kolera nedenini öğrenmek için hastaların mekansal boyutlarını şehir haritasına not etmeye karar verdi. Londra şehir haritasında hastaların ev adresinin yerini işaretledi. Bu alıştırma ile John Snow, koleradan muzdarip insanların belirli su kuyularının etrafında toplandığını anladı. Salgından kontamine bir pompanın sorumlu olduğuna ve yerel yetkililerin iradesine karşı pompayı değiştirdiğine kesinlikle inanıyordu. Bu değişiklik, kolera yayılmasını büyük ölçüde azalttı.

Snow daha sonra teorisini desteklemek için bir salgın haritası yayınladı ve bölgedeki 13 kamu kuyusunun yerlerini ve ev adresine göre haritalanan 578 kolera ölümünü gösterdi. Bu harita nihayetinde kolera'nın bulaşıcı bir hastalık olduğu ve su yoluyla hızla yayıldığı anlayışına yol açtı. John Snow'un deneyi, hastalığın nedenini bilmek ve ortadan kaldırmaya yardımcı olmak için kümeleme algoritmasını uygulamanın en eski örneğidir. On dokuzuncu yüzyılda John Snow, bir Londra şehir haritasına bir kalemle kümeleme algoritması uygulayabildi. Hedef hastalık olarak kanser ile, bu düzeyde bir analiz John Snow'un Analizi ile aynı kolaylıkla mümkün değildir. Bu verileri çıkarmak için gelişmiş araçlara ve teknolojilere ihtiyacımız var. Makine Öğrenimi ve Büyük Veri gibi modern teknolojilerin yeteneklerinden yararlandığımız yer burasıdır.

Büyük veri ve Makine öğrenimi – kanserle mücadele araçları

Makine öğrenimi algoritmaları ile birlikte büyük miktarda veri, kanserle mücadelemizde birçok yönden bize yardımcı olacaktır. Tanı, tedavi ve prognoz konusunda bize yardımcı olabilir. Esas olarak, başka türlü mümkün olmayan, hastaya göre terapinin özelleştirilmesine yardımcı olacaktır. Ayrıca, dağıtımın uzun kuyruğuyla başa çıkmaya yardımcı olacaktır.

Büyük Veri ve Makine Öğrenimi Kansere Karşı Birleşti UpGrad Blog
Çeşitli hastaneler tarafından üretilen ve kaydedilen muazzam miktarda Elektronik Tıbbi Kayıt (EMR) göz önüne alındığında; kanser teşhisinde 'etiketli' verileri kullanmak mümkündür. Doktor reçetelerini anlamlandırmak için Doğal Dil Programlama (NLP) gibi teknikler kullanılır ve CT ve MRI taramalarını analiz etmek için Derin Öğrenme Sinir Ağları kullanılır. Farklı türde makine öğrenimi algoritmaları, EMR veritabanlarını arar ve gizli kalıpları bulur. Bu gizli kalıplar kanser teşhisinde yardımcı olacaktır.

Bir üniversite öğrencisi, evinin rahatlığında bir Yapay Sinir Ağı tasarlamayı başardı ve meme kanserini yüksek doğrulukla teşhis edebilen bir model geliştirdi.

Büyük Veri ve Makine Öğrenimi ile Teşhis

Brittanny Wenger, büyük kuzenine meme kanseri teşhisi konduğunda 16 yaşındaydı. Bu, tanılamayı geliştirerek süreci daha iyi hale getirmesi için ona ilham verdi. İnce İğne Aspirasyonu (İİA) daha az invaziv bir biyopsi yöntemi ve en hızlı tanı yöntemiydi. Sonuçlar güvenilir olmadığı için doktorlar İİA'yı kullanmakta isteksizdiler. Britanny bu konuda bir şeyler yapmak için programlama becerilerini kullanmayı düşündü. Kadınların daha az invaziv ve rahat tanı yöntemlerini seçmelerini sağlayacak İİA'nın güvenilirliğini artırmaya karar verdi.

Brittanny, Wisconsin Üniversitesi'nden Fine Needle Aspiration'ı içeren kamu malı verileri buldu. İnsan beyni mimarisinin tasarımından ilham alan bir Yapay Sinir Ağı (YSA) kodladı. Verileri işlemek ve benzerlikleri bulmak için YSA'yı eğitmek için bulut teknolojilerini kullandı. Sonunda, birçok deneme ve hatadan sonra, ağı bir FNA test verisinden meme kanserini maligniteye karşı %99,1 hassasiyetle tespit edebildi. Bu yöntem diğer kanserlerin teşhisi için de geçerlidir.

Teşhisin doğruluğu, mevcut verilerin miktarına ve kalitesine bağlıdır. Ne kadar çok veri mevcutsa, algoritmalar o kadar çok veri tabanını sorgulayabilecek, benzerlikler bulabilecek ve değerli modeller ortaya çıkarabilecektir.

Büyük Veri ve Makine Öğrenimi ile Tedavi

Büyük veri ve Makine öğrenimi sadece teşhis için değil tedavi için de yardımcı olacaktır. John ve Kathy otuz yıldır evlilerdi. 49 yaşında Kathy'ye evre III meme kanseri teşhisi kondu. Bir Boston hastanesinin CIO'su John, tasarladığı ve hayata geçirdiği büyük veri araçlarının yardımıyla tedavisinin planlanmasına yardımcı oldu.

2008'de Harvard'a bağlı beş hastane veritabanlarını paylaştı ve 'Paylaşılan Sağlık Araştırma Bilgi Ağı' (SHRINE) olarak bilinen güçlü bir arama aracı oluşturdu. Kathy'nin teşhisi konduğunda, doktorları anlayışlı bilgiler bulmak için 6,1 milyon kayıttan oluşan bir veri tabanını gözden geçirebilirdi. Doktorlar 'TAPINAK'a “50 yaşındaki Asyalı kadın, evre III meme kanseri teşhisi ve tedavileri” gibi sorular sordu. Bu bilgiyle donanmış doktorlar, ameliyattan kaçınarak östrojene duyarlı tümör hücrelerini hedefleyerek onu kemoterapi ilaçları ile tedavi edebildiler.

Kathy kemoterapi rejimini tamamladığında radyologlar artık herhangi bir tümör hücresi bulamamıştı. Bu, büyük veri araçlarının her birinin gereksinimine göre tedavi planını özelleştirmede nasıl yardımcı olabileceğinin bir örneğidir.

Kanser uzun kuyruklu bir dağılım olduğundan 'herkese uyan tek beden' felsefesi işe yaramaz. Hastanın geçmişine, gen dizilimine, teşhis testlerinin sonuçlarına, genlerinde bulunan bir mutasyona veya genlerinin ve ortamının bir kombinasyonuna bağlı olarak tedavileri kişiselleştirmek için büyük veri ve makine öğrenme araçları vazgeçilmezdir.

Büyük Veri ve Makine Öğrenimi ile İlaç Keşfi

Büyük veri ve Makine öğrenimi yalnızca teşhis ve tedaviye yardımcı olmakla kalmayacak, aynı zamanda ilaç keşfinde devrim yaratacak. Araştırmacılar, FDA gibi kurumlar tarafından başka amaçlar için onaylanmış olan ilaçların yeni kullanımlarını keşfetmek için açık verileri ve hesaplama kaynaklarını kullanabilir. Örneğin, San Francisco'daki California Üniversitesi'ndeki bilim adamları, pinwormları tedavi etmek için kullanılan 'pirvinyum pamoat' adlı bir ilacın, farelerde bir tür karaciğer kanseri olan hepatoselüler karsinomu küçültebileceğini, sayıları çarpıtarak buldular. Karaciğer ile ilişkili olan bu hastalık, dünyada kanser ölümlerine en çok katkıda bulunan ikinci hastalıktır.

Büyük Veri ve Makine Öğrenimi Kansere Karşı Birleşti UpGrad Blog
Büyük veriler sadece eski uyuşturucuların yeni kullanımlarını keşfetmek için değil, aynı zamanda yeni uyuşturucuları tespit etmek için de kullanılabilir. Farklı ilaçlar, kimyasallar ve özellikleri, çeşitli hastalıkların semptomları, bu durumlar için kullanılan ilaçların kimyasal bileşimi ve bu ilaçların farklı ortamlardan toplanan yan etkileri ile ilgili verileri çatırdatarak; çeşitli kanser türleri için yeni ilaçlar tasarlanabilir. Bu, süreçte milyonlarca dolar harcamadan yeni ilaçlar bulmak için geçen süreyi önemli ölçüde azaltacaktır.

Büyük veri ve makine öğreniminin kullanılması, şüphesiz kanser tedavisinde teşhis, tedavi ve ilaç keşfi sürecini iyileştirecektir, ancak bunun zorlukları da yoktur. Önümüzdeki yolda birçok engel ve sorun var. Bu bloklar kaldırılmazsa ve bu zorluklarla karşılaşılmazsa, düşmanımız üstünlük elde edecek ve gelecekteki savaşta bizi yenecektir.

Kanserle savaşmak için Büyük Veri ve Makine Öğrenimi kullanmanın zorlukları

sayısallaştırma

Birkaç büyük ve teknik olarak gelişmiş hastane dışında, çoğu henüz dijitalleştirilmedi. Hala çok büyük dosya yığınlarında veri yakalama ve kaydetme eski yöntemlerini takip ediyorlar. Teknik uzmanlık, satın alınabilirlik, ölçek ekonomileri ve diğer çeşitli nedenlerden dolayı dijitalleşme gerçekleşmemiştir. Açık kaynaklı EMR yazılımının sağlanması, bu dijital kayıtların hastaların tedavisinde ne kadar yararlı olabileceğini ve hastanelere ne kadar karlı olduğunu öğretmek doğru yönde atılmış bazı adımlardır.

Kurumsal depolarda kilitli veriler

Bugün itibariyle sadece birkaç hastane hasta kayıtlarını dijital olarak yakalayabilmektedir. Bu aygıt da kurumsal depolarda kilitli ve dünyanın geneli tarafından erişilemez durumda.

Hastaneler veri tabanlarını diğer hastanelerle paylaşmak konusunda isteksizdir. İstekli olsalar bile, farklı veritabanı şemaları ve mimarileri tarafından rahatsız edilirler. Bu cephede hastanelerin birbirlerinden şüphe duymadan kendi veri tabanlarını karşılıklı yarar için nasıl paylaşabilecekleri konusunda eleştirel düşünmek gerekiyor. Bu verilerin de paylaşılacağı şema konusunda tüm hastanelerin yararına bir fikir birliğine varılması gerekiyor. Bu sabırlı veriler demokratikleştirilmeli ve insanlığın geleceğinin iyileştirilmesi için kullanılmalıdır.

Büyük Veri ve Makine Öğrenimi Kansere Karşı Birleşti UpGrad Blog
Hasta verilerinin tek bir organizasyonun büyümesi için kullanılmasına izin verilmemelidir. Verilerin ait olduğu kişinin anonimleştirilmesine azami özen gösterilmelidir. Bir kişinin ruj tercihi sızdırılmışsa pek bir zararı yoktur. Bir kişinin tıbbi geçmişi sızdırılırsa, yaşamı ve beklentileri üzerinde önemli bir etkisi olacaktır.

Devlet bu yönde olumlu adımlar atmalı ve tüm hastanelerdeki hastaların tıbbi kayıtlarının saklanması için büyük bir veri altyapısının oluşturulmasına yardımcı olmalıdır. Tüm hastanelerin bu ortak altyapı içerisinde veri tabanlarını paylaşmalarını zorunlu hale getirmelidir. Bu veri tabanına erişim, hasta tedavisi ve araştırması için ücretsiz hale getirilmelidir.

Makine Öğrenimi Algoritmalarının verimliliğinde iyileştirme

Makine öğrenimi, kanser teşhisi ve tedavisi için sihirli bir hap değildir. İyi kullanılırsa kanseri yenme yolculuğumuzda yardımcı olabilecek bir araçtır. Makine öğrenimi hala yeni bir aşamadadır ve dezavantajları vardır. Örneğin, bu algoritmaların eğitildiği verilerin, sonuç üretmek için kullanıldıkları verilere çok yakın olması gerekir. Aralarında büyük bir fark varsa, algoritma kullanılabilecek anlamlı sonuçlar sağlayamayacaktır.

Kendine özgü varsayımları, avantajları ve dezavantajları olan birçok makine öğrenme algoritması vardır. Tüm bu farklı algoritmaları, bizim için gerekli sonuçları elde etmek için bir araya getirmenin bir yolunu bulabilirsek, yani kanseri tedavi etmeyi, söylemeye bile gerek yok, çok faydalı bir sonuç bulmuş olurduk. Ünlü makine öğrenimi bilimcisi Pedro Domingos, aynı adı taşıyan popüler bir bilim kitabı da yazan buna “Usta Algoritma” diyor .
Pedro'ya göre, makine öğreniminde beş farklı düşünce okulu var. Sembolist, bağlantıcı, Bayesçi, evrimciler ve analojiciler. Bu makalede tüm bu farklı makine öğrenimi sistemlerine girmek zor. Gelecekteki bloglarımdan birinde beş tür makine öğrenimi sistemini ele alacağım. Şimdilik, tüm bu farklı yöntemlerin kendilerine göre avantaj ve dezavantajları olduğunu anlamamız gerekiyor. Bunları birleştirebilirsek, verilerimizden son derece etkili içgörüler elde edebiliriz. Bu, sadece her türlü tahmin ve tahmin için değil, aynı zamanda kinci bir düşman olan kansere karşı mücadelemiz için de son derece yararlı olacaktır.

Özetlemek gerekirse, kanser sık ​​sık şekil değiştiren çetin bir düşmandır. Bununla birlikte, yetkin bir şekilde yüzleşmek için cephaneliğimizde büyük veri ve makine öğrenimi şeklinde yeni silahlara sahibiz. Ama onu tamamen yok etmek için şu anda sahip olduğumuzdan daha güçlü bir silaha ihtiyacımız var. Bu silahın adı 'Usta Algoritma'.

Bu düşmanla savaşırken kullandığımız strateji ve yöntemlerde de bazı değişiklikler yapmamız gerekiyor. Bu değişiklikler büyük bir veri altyapısı oluşturarak hastanelerin anonim hasta kayıtlarını paylaşmasını zorunlu kılmakta, veri tabanının güvenliğini sağlamakta ve kanser tedavisine yönelik hasta tedavisi ve araştırmaları için veri tabanına ücretsiz erişime izin vermektedir.

Dünyanın en iyi Üniversitelerinden veri bilimi sertifikası alın . Kariyerinizi hızlandırmak için Yönetici PG Programları, İleri Düzey Sertifika Programları veya Yüksek Lisans Programları öğrenin.

toparlamak

Büyük Veri hakkında daha fazla bilgi edinmek istiyorsanız, çalışan profesyoneller için tasarlanmış ve 7+ vaka çalışması ve proje sağlayan, 14 programlama dili ve aracını kapsayan, pratik uygulamalı Büyük Veride Yazılım Geliştirme Uzmanlığı programında PG Diplomamıza göz atın çalıştaylar, en iyi firmalarla 400 saatten fazla titiz öğrenim ve işe yerleştirme yardımı.

Yazılım Mühendisliği derecelerini dünyanın en iyi üniversitelerinden çevrimiçi öğrenin . Kariyerinizi hızlandırmak için Yönetici PG Programları, Gelişmiş Sertifika Programları veya Yüksek Lisans Programları kazanın.

Veri Bilimi Kariyerinizi şimdi planlayın.

IIM-Kozhikode'den Veri Biliminde Profesyonel Sertifika Programına Başvurun