Bagaimana Membangun Program Python Analisis Sentimen Twitter? [Tutorial Langkah-demi-Langkah]
Diterbitkan: 2020-08-07Sumber
Ketika perusahaan menjadi semakin didorong oleh data, teknik Pembelajaran Mesin yang disebut 'Analisis Sentimen' semakin populer dari hari ke hari. Ini menganalisis data/teks digital melalui Natural Language Processing (NLP) untuk menemukan polaritas (positif, negatif, netral), perasaan, dan emosi (marah, senang, sedih, dll.) yang diungkapkan dalam teks.
Karena Twitter adalah salah satu sumber percakapan publik langsung yang paling komprehensif di seluruh dunia, perusahaan bisnis, kelompok politik, dll. tertarik untuk melakukan 'Analisis Sentimen' dari tweet untuk memahami emosi/pendapat pasar sasaran atau untuk mempelajari pasar pesaing . Meskipun mereka siap menggunakan program untuk tujuan tersebut tetapi untuk mencapai prediksi dengan tingkat akurasi yang tinggi, khusus untuk kriteria dan domain tertentu, cara terbaik adalah membuat model atau program Python Analisis Sentimen Twitter yang disesuaikan.
Daftar isi
Tutorial Langkah demi Langkah: Membuat Program Analisis Sentimen Twitter Menggunakan Python
Tutorial ini bertujuan untuk membuat Program Analisis Sentimen Twitter menggunakan Python. Program yang dihasilkan harus mampu mengurai tweet yang diambil dari twitter dan memahami sentimen teks, seperti polaritas dan subjektivitasnya.
Kelebihan
1. Yang terpenting adalah pengetahuan dasar pengkodean/pemrograman Python.
2. Alat yang akan diinstal di komputer Anda:

- Python
- Perpustakaan: Tweepy, gumpalan teks, cloud kata, panda, NumPy, matplotlib
(Tweepy adalah pustaka python resmi untuk API Twitter yang memungkinkan Python untuk berkomunikasi dengan platform Twitter)
3. Akun Twitter
4. Aplikasi Twitter perlu dibuat dan diautentikasi oleh Twitter: Ini diperlukan untuk mendapatkan 'Kunci Konsumen dan Token Akses' yang akan Anda perlukan dalam pemrograman.
Jika Anda belum memiliki Aplikasi Twitter yang dibuat untuk tujuan tersebut, berikut adalah cara membuatnya.
Baca lebih lanjut: Tutorial Python NumPy: Belajar Python Numpy Dengan Contoh
Bagaimana Cara Membuat Aplikasi Twitter?
- Buka situs pengembang Twitter: dev.twitter.com.
- Masuk dengan akun Twitter Anda
- Buka 'Aplikasi saya'
- Klik 'Buat aplikasi baru'.
- Selanjutnya, Anda perlu mengisi formulir, seperti yang ditunjukkan di bawah ini.
Sumber
- Selanjutnya, klik 'Buat Token Akses saya.'
- Di halaman berikutnya, pilih opsi 'Baca dan Tulis' di bawah kolom 'Jenis Aplikasi'.
Anda akan diberikan Pengaturan OAuth Aplikasi Twitter Anda, yang mencakup semua detail yang diperlukan terkait dengan kunci konsumen Anda, rahasia konsumen, Token akses, Rahasia token akses, dll. Anda perlu mencatat detail ini karena kredensial API ini akan memungkinkan Anda untuk mengambil tweet dari twitter. Lebih baik menyimpannya dalam file CSV di komputer Anda, yang terakhir Anda dapat langsung mengunggah file CSV ke program Anda untuk membaca kredensial API
Memulai dengan Membuat Program Python Analisis Sentimen Twitter
1. Impor Perpustakaan : Tweepy, gumpalan teks, cloud kata, panda, NumPy, matplotlib
2. Otentikasi Aplikasi Twitter: Selanjutnya, Anda perlu mengautentikasi aplikasi twitter Anda menggunakan kredensial Pengaturan OAuth Aplikasi Twitter, juga disebut sebagai kredensial API Twitter. Untuk ini, Anda perlu membuat objek Otentikasi, menggunakan kode seperti yang ditunjukkan pada gambar di bawah ini.
Sumber
Untuk mengisi kredensial API Twitter, Anda dapat mengunggah file CSV atau secara manual menyalin tempel detail kredensial.
3. Ambil Tweet dari Pengguna Twitter: Sekarang, untuk mengambil tweet, pertama-tama Anda harus memilih pengguna Twitter yang tweetnya ingin Anda urai untuk memahami sentimen yang diungkapkan di dalamnya. Katakanlah; Anda ingin melihat apakah tweet 'UserXYZ' positif atau negatif atau netral dengan melakukan analisis sentimen dari 100 tweet oleh UserXYZ.
Kode untuk mengambil tweet
posting = api.user_timeline(screen_name = ”UserXYZ”, count= 100, Lang =”en”, tweet_mode=“extended”)
Menjalankan perintah di atas akan muncul tweet.
4. Buat Bingkai Data: Sekarang, Anda perlu membuat bingkai data untuk tweet yang telah Anda ambil. Katakanlah Anda memberi nama kolom pertama df Anda sebagai 'Tweet', dan itu akan berisi semua tweet yang tersebar di 100 baris karena Anda menganalisis 100 tweet.
Df = pd.dataframe( [tweet.full_text untuk tweet di postingan] , kolom=[ 'Tweet'])
5. Membersihkan Teks: Membersihkan teks tweet penting untuk keberhasilan program python analisis sentimen twitter Anda, karena akan ada banyak simbol yang tidak diinginkan seperti @, #, re-tweet, hyperlink di URL, dll. pustaka python'' mulai digunakan.
Dapatkan Subjektivitas dan Polaritas: Setelah Anda membersihkan teks, Anda perlu membuat dua fungsi menggunakan pustaka python TextBlob untuk mendapatkan subjektivitas dan polaritas tweet. Subjektivitas menunjukkan seberapa besar opini teks, dan polaritas menggambarkan positif atau negatifnya teks. Akan lebih baik untuk menulis skrip python untuk membuat dua kolom lagi di bingkai data Anda untuk meng-host Subjektivitas dan Polaritas. Jadi, sekarang bingkai data Anda akan memiliki tiga kolom (pertama untuk tweet, ke-2 untuk subjektivitas, ke-3 untuk polaritas)

Kode untuk membuat fungsi Subjektivitas dan Polaritas adalah sebagai berikut:
Sumber
Setelah Anda menjalankan kode, Anda akan melihat skor subjektivitas dan polaritas setiap tweet yang ditampilkan di kolom masing-masing. TextBlob menggambarkan polaritas dalam skala 1 hingga -1. Jadi, jika sebuah tweet memiliki polaritas -0,4 berarti sedikit negatif, dan jika memiliki subjektivitas 0,6, maka itu cukup subjektif.
6. Selanjutnya, Anda dapat memilih untuk menyertakan awan kata dalam program Python Analisis Sentimen Twitter Anda , karena awan kata juga populer sebagai teknik visualisasi data yang digunakan untuk analisis sentimen, di mana ukuran kata menunjukkan pentingnya.
Contoh WordCloud:
Sumber
Pustaka matplotlib, Pandas, dan WordCloud akan beraksi yang telah Anda impor. Untuk memplot kata cloud terlebih dahulu, Anda perlu membuat variabel; beri nama 'allwords' untuk mewakili semua tweet di kolom 'Tweets' dari bingkai data.
Kode untuk membuat WordCloud
allwords = ' '.join( [twts untuk twts di df [ 'Tweets' ]] )
WordCloud = WordCloud (lebar =xxx, tinggi =xxx, randon_state =xxx, max_font_size =xxx. generate (allwords)
plt.imshow(wordcloud)
plt.axis("mati")
plt.tampilkan()
7. Karena Anda memiliki skor polaritas untuk setiap tweet, Anda dapat mulai menghitung analisis positif, negatif, dan netral dari tweet tersebut. Untuk ini, Anda perlu membuat fungsi, sebut saja 'Analisis', di mana Anda dapat menetapkan skor 0 ke netral, <0 ke negatif, dan >0 ke positif.
Analisis Def (skor):
Jika skor < 0
kembali 'Negatif.'
skor elif == 0
kembali 'netral
lain,
kembali 'positif.'
Selanjutnya, untuk meng-host hasil analisis sentimen dari tweet, buat kolom baru di bingkai data Anda, beri nama 'TwtAnalysis' lalu tulis kode berikut:
df [ 'TwtAnalysis' ] = df [ 'Polaritas' ]. terapkan (Analisis)
8. Bingkai data baru akan memiliki kolom tambahan bernama 'TwtAnalysis', dan akan merujuk ke setiap tweet baik sebagai positif, negatif, atau netral berdasarkan skor polaritasnya. Contoh ditunjukkan di bawah ini pada gambar:
Sumber

9. Setelah Anda memiliki klasifikasi tweet sebagai positif, negatif, dan netral, Anda dapat melanjutkan membangun program Python Analisis Sentimen Twitter Anda untuk mewakili data dalam format yang berbeda seperti:
- Dapatkan persentase tweet positif, negatif, atau netral.
- Cetak semua komentar positif atau tweet negatif atau netral secara terpisah
- Buat grafik analisis sentimen visual dari tweet positif, negatif, dan netral, dan banyak lagi.
Baca Juga: 9 Pustaka Python Teratas untuk Pembelajaran Mesin
Kesimpulan
Program Python Analisis Sentimen Twitter , dijelaskan di artikel ini, hanya satu cara untuk membuat program seperti itu. Pengembang dapat menyesuaikan program dalam banyak cara agar sesuai dengan spesifikasi untuk mencapai akurasi tertinggi dalam pembacaan data, itulah keindahan pemrograman melalui python, yang merupakan bahasa yang hebat, didukung oleh komunitas pengembang yang aktif dan terlalu banyak perpustakaan.
Python memiliki cakupan yang sangat luas dalam bidang Pembelajaran Mesin dan Ilmu Data. Mereka yang menggeluti dunia pemrograman tahu betul bahwa Machine Learning akan terus menjadi salah satu terobosan pemrograman di masa depan.
Jika Anda ingin mendapatkan pengalaman belajar yang komprehensif dan terstruktur, juga jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat Diploma PG IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk profesional yang bekerja dan menawarkan 450+ jam pelatihan yang ketat, 30+ studi kasus & tugas, status Alumni IIIT-B, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.
Apa kepentingan fungsional dari analisis sentimen di media sosial?
Di era media sosial ini, opini konsumen memiliki kekuatan tak terbatas untuk membuat atau menghancurkan sebuah merek. Analisis sentimen adalah cara terbaik untuk memahami faktor pendorong di balik opini dan emosi konsumen secara akurat. Dengan data yang tersedia dari analisis sentimen, bisnis dapat menemukan audiens target mereka, mengidentifikasi influencer media sosial untuk merek mereka, dan melihat tren pasar yang sedang berkembang. Selain itu, analisis sentimen pada platform media sosial juga menawarkan gagasan komprehensif tentang kesehatan merek mereka; bisnis dapat menerima umpan balik konsumen yang jujur tentang produk dan layanan mereka yang baru diluncurkan untuk meningkatkannya. Ini juga efektif dalam menangani reputasi online dengan mengidentifikasi cakupan perbaikan dan penyelesaian masalah dengan lebih baik.
Bisakah Anda belajar Python sendiri?
Jika Anda memiliki beberapa tingkat pengalaman dengan pemrograman, Anda pasti bisa mulai belajar Python sendiri. Python hadir dengan struktur sintaksis yang relatif sederhana dan juga intuitif, membuatnya mudah dipahami bahkan untuk pemula. Selain itu, mudah untuk menginstal paket dan menjalankannya di mesin Anda dari mana saja. Anda dapat mempercepat pembelajaran Anda dengan mendaftar di kursus Python, menghadiri bootcamp coding. Dengan komunitas pengembang aktif yang selalu bersedia memberikan dukungan, sumber belajar yang berlimpah, dan dokumentasi, pemula dapat mempelajari dasar-dasar Python dalam waktu sekitar 7-8 minggu.
Mana yang lebih sulit dipelajari antara Python dan C++?
Python dan C++ adalah bahasa pemrograman yang sama sekali berbeda dengan perilaku dan fitur yang sama sekali berbeda. Namun, keduanya sangat mendukung pemrograman berorientasi objek. Tetapi mengingat kerangka kerja Python secara keseluruhan, ini sangat mudah, lebih mudah, dan lebih cepat untuk dipelajari daripada C++. Faktanya, banyak orang belajar Python untuk merasakan seperti apa pengkodean sederhana itu. Python adalah open-source, gratis, dan menawarkan keandalan dan kemudahan yang luar biasa dalam mengembangkan aplikasi pembelajaran mesin yang kompleks. Sementara C++ lebih efisien dalam hal kinerja, itu tidak dianggap cocok dibandingkan Python untuk proyek pembelajaran mesin.