Menguasai NumPy: Inisialisasi Cara, Operasi & Fungsi Ndarray

Diterbitkan: 2021-01-05

Numpy adalah paket Python yang memungkinkan operasi matematika dan numerik dilakukan dengan efisiensi tinggi dan fungsionalitas abstrak pada data dimensi tinggi. Saat membangun solusi Machine Learning untuk kasus penggunaan bisnis tertentu, menjadi sangat penting untuk mengubah data sedemikian rupa sehingga pra-pemrosesan menjadi mudah, dan hasilnya dapat diinterpretasikan. Numpy adalah pustaka inti yang memungkinkan untuk melakukan semua fungsi terkait dengan cara terbaik.

Daftar isi

Mengapa NumPy?

Pustaka Ilmu Data lainnya seperti Pandas, Matplotlib, dan Scikit-learn dibangun di atas Numpy karena sifatnya yang berkinerja tinggi. Pustaka ini menawarkan ndarray yang digunakan sebagai pengganti daftar python bawaan. Daftar Python sangat bagus untuk menyimpan nilai, tetapi itu harus dibayar dengan peningkatan waktu eksekusi karena menyimpan pointer dari lokasi memori yang menambahkan overhead dalam hal memori dan eksekusi.

Numpy menemukan penggunaan langsungnya di bidang pemrosesan gambar di mana gambar diproses sebagai matriks multidimensi tinggi untuk melakukan berbagai transformasi seperti pengaburan, perubahan warna, dan deteksi objek.

Mari kita lihat beberapa fungsi Numpy penting yang harus diketahui oleh setiap calon Ilmu Data tetapi sebelum itu:

  1. Semua kode fungsi di bawah ini mengasumsikan bahwa perpustakaan telah diimpor dengan alias np, yaitu import numpy sebagai np.
  2. Istilah "array" akan digunakan untuk mendefinisikan ndarray setelah titik ini.

Berbagai Cara untuk Inisialisasi

1. Spasi Linier

Fungsi ini dimaksudkan untuk menyediakan array spasi linier dalam rentang nilai. Fungsi np.linspace(start, stop, num) di mana start dan stop menentukan rentang nilai dan num menentukan jumlah sampel, mengembalikan nilai dengan jarak yang sama sedangkan np.arange(start, stop, step) mengembalikan nilai yang berbeda nilai langkah.

2. Nilai Khusus

Dalam banyak contoh, Anda mungkin ingin menginisialisasi matriks besar dengan nilai-nilai seperti satu, nol, identitas, atau nilai konstan. Ukuran array dilewatkan sebagai tupel. Numpy memfasilitasi ini melalui fungsi yang berbeda:

    • np.zeros(size): Elemen adalah nol
    • np.ones(size): Elemen adalah satu
    • np.full(size, constant value): Elemen adalah nilai konstan yang dilewatkan.
    • np.eye(size): Elemen diagonal adalah satu dan sisanya nol. Ini adalah matriks identitas.
    • np.kosong(ukuran): Matriks kosong
    • np.random.random(size): Matriks nilai acak diinisialisasi dari ukuran yang ditentukan.

Baca: Pertanyaan Wawancara Numpy

Operasi Ndarray

Tujuan utama dari perpustakaan ini adalah perhitungan yang efisien antara array yang berbeda. Numpy mendukung hampir semua jenis operasi matematika dan manipulasi yang diterapkan dari segi elemen. Beberapa di antaranya tercantum di bawah ini (Asumsikan dua array A dan B dengan ukuran yang sama diinisialisasi dengan nilai acak):

1. Matematika

  • np.add(A, B): Tambahan
  • np.kurangi(A, B): Pengurangan
  • np.divide(A, B): Divisi
  • np.multiply(A, B): Perkalian
  • np.exp(A): Nilai eksponensial
  • np.sqrt(A): Nilai Akar Kuadrat
  • np.sin(A), cos(A), tan(A): Nilai trigonometri
  • np.log(A): Nilai logaritma
  • np.percentile(A, persentil diperlukan, sumbu): Saat melewati nilai persentil, misalnya, 50, fungsi akan mengembalikan persentil ke-50 dari array.
  • A.dot(B): Mengembalikan produk titik dari array
  • A == B: Perbandingan bijaksana elemen
  • np.array_equal(A, B): Perbandingan bijaksana array
  • A.sum(): Jumlah semua elemen
  • A.min(), max(): Nilai Minimum dan Maksimum
  • A.cumsum(): Jumlah Kumulatif elemen array
  • A.corrcoef(): Koefisien korelasi

2. Manipulasi

  • np.transpose(A) atau AT: Transpose matriks
  • A.ravel(): Meratakan array
  • A.reshape(new_shape): membentuk ulang array (di sini berikan ukuran secara langsung tanpa memasukkannya ke dalam Tuple). Ukuran baru harus sama dengan
  • A.resize(size): mengubah bentuk array menjadi bentuk apapun dan membuang elemen lain yang bukan bagian dari bentuk baru ini.
  • np.concatenate((A,B), axis=1 atau 0)
  • np.vstack((A,B)): Tumpuk array secara vertikal (baris-bijaksana)
  • np.hstack((A,B)): Tumpukan horizontal

Lihat: Numpy vs Panda: Perbedaan Antara

Fungsi Lain-lain

  • np.where(): Ini adalah fungsi penting yang menghilangkan kebutuhan akan pernyataan if-else. Dibutuhkan 3 argumen penting: kondisi, nilai jika kondisi terpenuhi, dan nilai jika tidak. Contoh sederhananya adalah ketika Anda harus melakukan binerisasi kolom berdasarkan ambang batas yang diberikan.
  • np.intersect1d(): Fungsi ini mengembalikan perpotongan dua larik 1-d. Ini berarti bahwa nilai umum dari array ini dikembalikan oleh fungsi ini. Jika array yang dilewatkan bukan 1-d maka diratakan.
  • np.allclose(): Ini adalah fungsi yang menarik. Ada situasi di mana Anda dapat membeli beberapa tingkat toleransi saat membandingkan array atau Anda ingin menemukan array serupa. Fungsi ini mengambil array dan nilai toleransi yang Anda inginkan. Contohnya:
    • arr1 = np.array([1,2,3,4])
    • arr2 = np.array([2,3,4,5])
    • np.allclose(arr1, arr2, 0.5) : akan mengembalikan False
    • np.allclose(arr1, arr2, 1): akan mengembalikan True
  • argmin(), argmax(), dan argsort(): Seperti namanya, fungsi-fungsi ini mengembalikan indeks dari nama masing-masing. A.argmin() mengembalikan indeks elemen minimum, A.argmax() sebaliknya, dan A.argsort() mengembalikan indeks dari array yang diurutkan. Fungsi-fungsi ini dapat berguna di mana hasilnya tergantung pada indeks.
  • np.clip(): Ini digunakan untuk mengonversi nilai dalam rentang tertentu. Misalnya, jika array memiliki nilai dari 1 hingga 30 dan Anda menginginkan nilai antara 14 hingga 27 tanpa kehilangan nilai lain, fungsi ini akan menaikkan skala nilai kurang dari 19 hingga 19 dan menurunkan nilai lebih besar dari 27 hingga 27.

Kesimpulan

Ada lebih banyak fungsi saat beroperasi pada array numpy, tetapi ini adalah fungsi yang paling sering digunakan. Operasi yang diterapkan pada kolom atau deret Panda sebenarnya pada ndarray karena deret tersebut adalah ndarray satu dimensi.

Numpy adalah alat yang hebat untuk menghasilkan Data palsu untuk menguji algoritme tertentu atau mensimulasikan skenario. Ini banyak digunakan dalam aplikasi visi komputer di mana gambar diubah menjadi matriks multidimensi untuk melakukan operasi yang diperlukan atau dalam pembelajaran mendalam di mana bobot jaringan saraf dipegang oleh ndarray ini.

Jika Anda penasaran untuk belajar tentang ilmu data, lihat Diploma PG IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan pakar industri, 1- on-1 dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.

Persiapkan Karir Masa Depan

DIPLOMA PG DARI IIIT-B, 100+ JAM PEMBELAJARAN KELAS, 400+ JAM PEMBELAJARAN ONLINE & DUKUNGAN KARIR 360 DERAJAT
Belajarlah lagi