Advertisement

Top online courses in IT & Software

10 Python Library untuk Data Science

Python Library

Seperti yang kita semua tahu, perpustakaan adalah ruangan atau tempat dimana terdapat koleksi buku yang disimpan untuk dibaca. Seperti halnya dalam dunia pemrograman, library adalah kumpulan kode yang telah dikompilasi sebelumnya yang dapat digunakan nanti dalam suatu program untuk beberapa operasi tertentu yang terdefinisi dengan baik. Selain kode yang telah dikompilasi sebelumnya, library juga berisi dokumentasi, data konfigurasi, templat pesan, kelas, dan nilai, dll.

Python library adalah kumpulan modul atau fungsi-fungsi terkait. Ini berisi kumpulan kode yang dapat digunakan berulang kali dalam program yang berbeda. Python library membuat pemrograman dengan bahasa Python lebih sederhana dan nyaman bagi programmer. Karena kita tidak perlu menulis kode yang sama berulang kali untuk program yang berbeda. Python library memainkan peran yang sangat penting dalam bidang machine learning, Data science, Visualisasi Data, dll.

Baca juga : Proses Analisis Data

Berikut ini adalah 10 Python library yang penting untuk digunakan oleh para data scientist :

  1. Pandas

Panda adalah library penting bagi para data scientist. Ini adalah library untuk machine learning yang bersifat open-source dan menyediakan struktur data tingkat tinggi yang fleksibel dan berbagai alat analisis. Library ini memudahkan analisis data, manipulasi data, dan pembersihan data. Panda mendukung operasi seperti penyortiran, pengindeksan ulang, iterasi, penggabungan, konversi data, visualisasi, agregasi, dll. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi Pandas yaitu https://pandas.pydata.org/.

Pandas

       2.  Numpy

Numpy adalah singkatan dari “Numerical Python”. Sama halnya dengan Pandas, library ini juga merupakan source code yang populer dan umum digunakan untuk analisis data dan machine learning. Ini terdiri dari fungsi-fungsi matematika built-in untuk perhitungan yang mudah. Bahkan perpustakaan seperti TensorFlow menggunakan Numpy secara internal untuk melakukan beberapa operasi pada TensorFlow. Array interface adalah salah satu fitur utama dari library ini. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi Numpy yaitu https://numpy.org/.

Numpy

Baca juga : Visualisasi Data Dengan Grafik

       3.  Matplotlib

Matplotlib bertanggung jawab untuk melakukan plot data numerik. Dan itulah mengapa digunakan dalam analisis data. Ini juga merupakan open-source library dan memplot angka-angka ke dalam bentuk visualisasi data seperti diagram lingkaran, histogram, scatterplot, grafik, dll. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi Matplotlib yaitu https://matplotlib.org/.

Matplotlib

       4.  Seaborn

Seaborn memudahkan untuk menghasilkan plot seperti heat map, time series, dan violin plot. Itu dibangun di atas matplotlib dan terintegrasi erat dengan struktur data library Pandas. Seaborn membantu Anda menjelajahi data Anda. Fungsi plotnya beroperasi pada kerangka data dan array yang berisi seluruh kumpulan data dan secara internal melakukan pemetaan semantik dan agregasi statistik yang diperlukan untuk menghasilkan plot yang informatif. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi Seaborn yaitu https://seaborn.pydata.org/.

Seaborn

Baca juga : 2 Skill Utama Seorang Data Analyst

       5.  Scikit-Learn

Ini adalah perpustakaan Python yang terkenal untuk bekerja dengan data yang kompleks. Scikit-learn adalah open-source library yang mendukung machine learning. Ini mendukung berbagai algoritma yang diawasi dan tidak diawasi seperti regresi linier, klasifikasi, pengelompokan, dll. Library ini bekerja sama dengan Numpy dan SciPy. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi Scikit-Learn yaitu https://scikit-learn.org/stable/.

Scikit Learn

       6.  Keras

Keras adalah deep learning API yang ditulis dengan Python, berjalan di atas platform TensorFlow machine learning. Library ini dikembangkan dengan fokus pada eksperimen cepat. Mampu pergi dari ide ke hasil secepat mungkin adalah kunci untuk melakukan penelitian yang baik. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi Keras yaitu https://keras.io/.

Keras

        7.  Pytorch

PyTorch adalah tensor library yang dioptimalkan terutama digunakan untuk aplikasi deep learning menggunakan GPU dan CPU. Ini adalah open-source library untuk machine learning Python, terutama dikembangkan oleh tim Riset AI Facebook. Ini adalah salah satu machine learning library yang banyak digunakan, yang lainnya adalah TensorFlow dan Keras. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi Pytorch yaitu https://pytorch.org/.

pytorch

        8.  TensorFlow

Library ini dikembangkan oleh Google bekerja sama dengan Brain Team. Ini adalah open-source library yang digunakan untuk komputasi tingkat tinggi. Ini juga digunakan dalam machine learning dan algoritma deep learning. Ini berisi sejumlah besar operasi tensor. Peneliti juga menggunakan library ini untuk menyelesaikan komputasi kompleks dalam Matematika dan Fisika. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi TensorFlow yaitu https://www.tensorflow.org/.

TensorFlow

        9.  NLTK

Natural Language Toolkit (NLTK) adalah platform yang digunakan untuk membangun program Python yang bekerja dengan data bahasa manusia untuk diterapkan dalam statistik Natural Language Preprocessing (NLP). Library ini berisi koding untuk pemrosesan teks seperti tokenization, parsing, klasifikasi, stemming, tagging, dan penalaran semantik. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi NLTK yaitu https://www.nltk.org/.

NLTK

        10.  Spacy

Spacy adalah open-source library yang digunakan dalam pemrosesan bahasa alami tingkat lanjut dan pembelajaran mesin. Ini akan digunakan untuk membangun ekstraksi informasi, sistem pemahaman bahasa alami, dan pra-proses teks untuk deep learning. Untuk info lebih lengkap terkait instalasi dan dokumentasi bisa dilihat pada website resmi Spacy yaitu https://spacy.io/.

Spacy

 

Sekian artikel kali ini tentang 10 library Python untuk aplikasi di bidang data science dan AI. Semoga atikel ini membantu teman-teman untuk mengenal dan menjelajahi dunia pemrograman. Jangan lupa like dan share artikel ini untuk mendukung Tukang Catat membuat artikel-artikel lainnya. See you!

Posting Komentar

0 Komentar