Struktur Data Non Primitif
Berbeda dengan data primitif, tipe data non primitif tidak hanya menyimpan nilai, tapi juga sekumpulan nilai dalam format yang berbeda-beda. Beberapa variabel pada struktur data non primitif adalah list, tuple, dictionary, dan sets. List adalah struktur data paling serbaguna pada python dan ditulis sebagai list element yang dipisahkan dengan koma dan diapit oleh tanda kurung siku. List bisa terdiri dari element homogen dan heterogen. Beberapa metode yang dapat diterapkan pada list adalah index(), append(), extended(), insert(), remove(), pop(), dan lain sebagainya. Data tuple mirip dengan list tetapi elemennya tidak bisa diubah. Perbedaan lain antara tuple dan list adalah tuple ditulis didalam kurung bukan kurung siku. Setelah elemen didefinisikan dalam tuple, maka elemen ini tidak dapat dihapus, dipindah, maupun diedit sehingga nilai yang telah didefinisikan tidak dapat dimanipulasi maupun diganti. Data dictionary terdiri dari pasangan "value-key". "key" mengidentifikasi item, dan "value" menyimpan nilai item yang akan dipisahkan oleh tanda titik dua. Item dipisahkan dengan koma dan diapit tanda kurung kurawal. "key" tidak bisa diubah sedangkan "value" dapat berupa tipe data jenis apapun. Sets adalah kumpulan elemen unik yang tidak berurutan. Seperti list, sets dapat diubah dan ditulis di dalam tanda kurung siku namun tidak boleh ada angka yang nilainya sama.
Yuk, Kita Mulai Rintis Karir Data Science dari Sekarang!
Profesi Data Scientist di era transformasi teknologi kini menjadi profesi yang populer. Siapa saja dan dari mana saja latar belakang pendidikannya dapat berkarir menjadi data scientist. Kita dapat memulai belajar otodidak atau melalui kursus data science baik online maupun offline. Oleh karena itu untuk mengetahui lebih lanjut terkait data scientist kita dapat mempelajarinya di DQLab lohh. Caranya sangat mudah, yaitu cukup signup di DQLab.id/signup dan nikmati momen belajar gratis bersama DQLab dengan mengakses module gratis dari R, Python atau SQL!
Penulis : Latifah Uswatun Khasanah
Editor : Annissa Widya Davita
Struktur data dan algoritma pada python merupakan dua konsep mendasar dalam dunia computer science. Kedua konsep tersebut merupakan tools yang paling diperlukan oleh programmer di seluruh dunia. Struktur data pada python berhubungan dengan penyimpanan database sedangkan algoritma python merupakan serangkaian instruksi rinci yang membantu dalam pemrosesan data untuk tujuan tertentu. Struktur data adalah serangkaian cara untuk mengatur dan menyimpan data serta berisi hubungan data dan berbagai operasi logis yang bisa diterapkan pada data. Struktur data dibagi menjadi dua, yaitu struktur data primitif dan non primitif. Data yang termasuk kedalam tipe primitif adalah integer, float, strings, dan boolean, sedangkan yang termasuk data non primitif adalah array, list, tuple, dictionary, sets, dan files, Beberapa tipe data non primitif seperti list, tuple, dictionary, dan sets sudah ada di dalam python.
Algoritma python merupakan sekumpulan instruksi yang dijalankan untuk mendapatkan solusi dari masalah yang ada. Algoritma tidak hanya dikhususkan untuk bahasa, oleh karena itu algoritma dapat diimplementasikan dalam beberapa bahasa pemrograman. Tidak ada aturan standar untuk menulis algoritma. Algoritma ini bergantung pada sumber daya dan masalah yang akan dipecahkan. Namun, ada konstruksi kode umum yang bisa digunakan, seperti flow control (if-else) dan loop (do, while, for). Pada artikel kali ini DQLab akan membahas struktur data dan algoritma pada python. Penasaran? Yuk simak artikel ini sampai akhir!
Berapa lama waktu untuk mempelajari Python?
Waktu yang Anda butuhkan untuk belajar python pemula akan bergantung pada beberapa faktor, termasuk tujuan utama Anda belajar bahasa pemrograman ini. Misalnya, jika Anda ingin mempelajari python sekadar untuk mengautomasi tugas tertentu di tempat kerja, Anda mungkin dapat mempelajarinya lebih cepat.
Berbeda halnya jika Anda ingin mempelajari python secara mendalam untuk mendapatkan pekerjaan sebagai analis data, Anda mungkin membutuhkan waktu yang lebih lama. Berikut adalah beberapa faktor lain yang dapat memengaruhi seberapa cepat Anda dapat mempelajari python:
Secara umum, dibutuhkan sekitar dua hingga enam bulan untuk mempelajari dasar-dasar python. Namun, Anda bisa belajar untuk menulis program pendek pertama dalam hitungan menit. Sementara itu, menguasai python secara lengkap bisa memakan waktu berbulan-bulan hingga bertahun-tahun.
Macam-macam library python
Ada beberapa jenis library yang populer di kalangan data scientist, di antaranya:
TensorFlow adalah platform end-to-end open-source untuk membuat aplikasi machine learning atau komputasi numerik cepat yang dibuat dan dirilis oleh Google. Library dasar ini dapat dipakai untuk membuat model deep learning secara langsung atau menggunakan library wrapper untuk menyederhanakan proses yang dibangun di atas TensorFlow.
Fitur utama TensorFlow meliputi bekerja secara efisien dengan ekspresi matematika yang melibatkan array multidimensi, dukungan yang baik dari jaringan saraf yang dalam dan konsep machine learning, hingga komputasi GPU/CPU di mana kode yang sama dapat dieksekusi pada kedua arsitektur.
NumPy (Numerical Python) adalah library python yang digunakan untuk bekerja dengan array dan juga memiliki fungsi yang bekerja dalam domain aljabar linier, transformasi fourier, dan matriks. Library yang dibuat pada 2005 oleh Travis Oliphant ini merupakan proyek open source sehingga Anda dapat menggunakannya secara bebas. Meski python memiliki daftar yang melayani tujuan array, prosesnya begitu lambat sehingga memerlukan NumPy yang bisa menyediakan objek array hingga 50 kali lebih cepat daripada daftar python tradisional.
SciPy (Scientific Python) adalah perpustakaan open-source yang digunakan untuk perhitungan ilmiah tingkat tinggi. Jenis library ini dibangun di atas ekstensi NumPy dan bekerja bersama untuk menangani komputasi yang kompleks. NumPy memungkinkan pengurutan dan pengindeksan data array, sementara kode data numerik disimpan di SciPy. Library python ini juga banyak digunakan oleh para developer dan engineer.
Pandas adalah perpustakaan penting bagi para data scientist. Library untuk machine learning yang bersifat open source ini menyediakan struktur data tingkat tinggi yang fleksibel serta berbagai alat analisis. Penggunaannya memudahkan analisis data, manipulasi data, dan pembersihan data. Pandas mendukung berbagai jenis operasi seperti penyortiran, pengindeksan ulang, iterasi, penggabungan, konversi data, visualisasi, agregasi, dan lain sebagainya.
Jenis library ini bertanggung jawab untuk merencanakan data numerik. Itulah alasan Matplotlib digunakan dalam analisis data. Library python yang bersifat open source ini dapat memplot angka-angka berdefinisi tinggi seperti diagram lingkaran, histogram, scatterplot, grafik, dan lain-lain.
Keras adalah API deep learning yang ditulis dengan python dan berjalan di atas platform machine learning TensorFlow. Dengan lebih dari satu juta pengguna individu pada akhir tahun 2021, penggunaan Keras saat ini terbilang masif, baik di industri maupun komunitas penelitian. Bersama dengan TensorFlow, Keras lebih banyak dipakai daripada solusi deep learning lainnya dan sangat populer di kalangan startup yang menempatkan deep learning sebagai inti dari produk yang ditawarkan.
Tanpa disadari, Anda pun terus berinteraksi dengan fitur yang dibuat dengan Keras (fitur yang salah satunya digunakan di Netflix). Keras & TensorFlow juga merupakan favorit di antara para peneliti, bahkan diadopsi oleh para peneliti di organisasi ilmiah besar, seperti CERN dan NASA.
Scikit-learn adalah library python terkenal yang digunakan untuk data kompleks. Perpustakaan open source ini mendukung machine learning dengan mendukung berbagai algoritma yang diawasi dan tidak diawasi seperti regresi linier, klasifikasi, pengelompokan, dan lain sebagainya. Library ini bekerja sama dengan Numpy dan SciPy.
PyTorch adalah perpustakaan machine learning terbesar yang mengoptimalkan komputasi tensor. Ia memiliki API yang kaya untuk melakukan komputasi tensor dengan akselerasi GPU kuat, membuatnya mampu membantu memecahkan masalah aplikasi yang terkait dengan jaringan saraf.
Perpustakaan tensor yang dioptimalkan ini utamanya digunakan untuk aplikasi deep learning menggunakan GPU dan CPU. Library phyton yang sebagian besar dikembangkan oleh tim Riset AI Facebook ini merupakan salah satu yang paling banyak digunakan di samping TensorFlow dan Keras.
Scrapy juga termasuk perpustakaan open source yang digunakan untuk mengekstraksi data dari website. Library ini menyediakan perayapan web yang sangat cepat, pengikisan layar tingkat tinggi, serta juga bisa digunakan untuk data mining dan pengujian data otomatis.
Belajar python dapat memperluas peluang pasar kerja global. Dengan belajar python yang adalah salah satu dari tiga bahasa pemrograman teratas di dunia, Anda berkesempatan memasuki dunia kerja dalam industri yang diprediksi akan menjadi paling populer ini, sehingga dapat membangun karier yang lebih baik.
Faktanya, menurut Indeks PopularitY of Programming Language (PYPL) yang dibuat dengan menganalisis frekuensi tutorial bahasa yang dicari di Google, python adalah bahasa pemrograman paling populer di seluruh dunia. Jadi, jika Anda ingin berkarier di negara lain, seperti Swiss atau Australia, belajar python akan membantu Anda memiliki peluang bagus untuk mendapatkan pekerjaan di sana. Di mana pun Anda ingin bekerja, menambahkan python ke dalam daftar keahlian Anda bisa menjadi “tiket” bekerja ke mana saja.
Kelebihan dan Kekurangan Selection Sort
Struktur Data Primitif
Struktur data primitif merupakan struktur data dasar pada python yang berisi nilai data murni, sederhana, dan berfungsi sebagai blok untuk memanipulasi data. Ada empat variabel pada struktur data primitif, yaitu integer (bilangan bulat), float, string, dan boolean. Tipe data string digunakan untuk mewakili data numerik, yaitu bilangan bulat positif atau negatif tanpa titik desimal, contohnya -2, 1, atau 10. Data float menandakan bilangan real floating point. Data ini digunakan untuk mewakili bilangan rasional, biasanya berisi titik desimal seperti 1,5 atau 5,32. Karena python merupakan bahasa pemrograman yang diketik secara dinamis, tipe data yang disimpan oleh objek bisa berubah dan tidak perlu mendefinisikan tipe variabel secara eksplisit. Tipe data string menunjukkan kumpulan huruf, kata, maupun karakter alfanumerik. Tipe ini dibuat dengan memasukkan serangkaian karakter dan dipisahkan dengan tanda petik satu maupun dua. Contoh penulisan tipe data string pada python adalah "kucing", "meja", ataupun "kelinci". Tipe data boolean berguna dalam perbandingan bersyarat dan dapat mengambil nilai TRUE maupun FALSE.
Baca juga : 3 Jenis Algoritma Machine Learning yang Dapat Digunakan di Dunia Perbankan
Analisis Kompleksitas Waktu dan Ruang
Selection Sort memiliki kompleksitas waktu sebesar O(n^2) baik pada kasus terbaik, kasus rata-rata, maupun kasus terburuk. Hal ini disebabkan oleh dua loop bersarang yang masing-masing berjalan sebanyak n kali. Meskipun Selection Sort tidak efisien untuk daftar yang sangat besar, algoritma ini memiliki beberapa kelebihan, seperti kesederhanaan dan kemudahan implementasi.
Kompleksitas ruang dari Selection Sort adalah O(1), karena algoritma ini hanya membutuhkan ruang tambahan yang konstan untuk variabel temporer dalam proses penukaran elemen.
Baca juga: Analisis Performa Algoritma Backpropagation Jaringan Syaraf Tiruan
Perbedaan Utama SQL dan Python
Perbedaan SQL dan Python yang paling signifikan adalah SQL digunakan oleh developer untuk mengakses dan mengekstrak data dari database. Python sendiri digunakan untuk menganalisis dan memanipulasi data dengan menjalankan tes regresi, tes deret waktu (time-series test), dan bentuk penghitungan data lainnya.
SQL adalah bahasa pemrograman yang sederhana dan memiliki ragam fungsi yang lebih sempit dibandingkan dengan Python. Dengan pustakanya yang besar, kode Python bisa diintegrasikan dengan banyak aplikasi lain. Python adalah bahasa pemrograman fleksibel dengan banyak fitur yang membuatnya disukai dan bisa dipelajari oleh nondeveloper sekaligus.
Baru-baru ini, sebuah survei dari Statista menunjukkan bahwa empat database management system paling populer di dunia adalah Oracle, MySQL, Microsoft SQL Server, dan PostgreSQL. Keempat sistem ini memiliki dasar SQL yang menunjukkan bahwa siapapun yang ingin menjadi seorang profesional di dunia data science akan mendapatkan keuntungan jika memahami SQL.
Di mana tempat belajar python untuk Data Science?
Data science merupakan ilmu yang mempelajari tentang tata cara mengumpulkan data, mengolah data, menganalisis data, dan memvisualisasikan data sampai menghasilkan informasi dari data tersebut. Data science merupakan ilmu yang menggabungkan beberapa ilmu di dalamnya seperti statistika, matematika, aljabar linier, sistem informasi, pemahaman bisnis, dan lain-lain. Data science pun diterapkan menggunakan bahasa pemrograman, salah satunya Python. Perlu diketahui bahwa Python tidak hanya untuk membuat aplikasi atau software. Bahkan pada masa kini, Python data science pun cukup sering digunakan dan menjadi favorit.
Python merupakan salah satu bahasa pemrograman yang cukup populer dan sering digunakan dan cukup banyak diminati. Bahasa pemrograman in tergolong bahasa pemrograman yang sederhana dan mudah dan menyediakan library yang sangat banyak. Python memiliki beberapa kelebihan seperti lebih efisien dalam hal kecepatan dan ketepatan dalam membaca kode. Bahasa pemrograman Python pun cukup sering digunakan untuk membuat aplikasi. Bahkan Google, Youtube, Instagram, Spotify pun menggunakan bahasa pemrograman Python. Nah, untuk data science kira-kira library apa saja ya yang populer digunakan?
Numpy yang merupakan singkatan dari Numerical Python merupakan library yang cukup banyak digunakan dalam proses analisis data. Numpy dapat digunakan untuk operasi vektor dan matriks serta dapat mengelola array. Salah satu kelebihan dari numpy adalah dapat terintegrasi dengan beberapa bahasa pemrograman lainnya. Perlu diketahui bahwa library Numpy merupakan bagian dari library Scipy. Sebelum digunakan, Numpy perlu di import terlebih dahulu dengan cara mengetikkan import numpy as np.
Baca juga : Belajar Data Science Secara Otodidak? Berikut langkah-langkahnya!
Matplotlib merupakan salah satu library dalam Python yang digunakan untuk proses visualisasi data. Visualisasi data merupakan salah satu tahapan penting agar hasil analisis mudah dipahami. Matplotlib berisi fungsi-fungsi yang dapat mengatur plot dalam gambar, menambah label di plot, dan lain-lain. Matplotlib dapat digunakan untuk visualisasi data dalam bentuk 2D maupun 3D. Adapun cara untuk mengimport library Python adalah dengan mengetikkan import matplotlib as mpl atau import matplotlib.pyplot as plt.
Pandas merupakan salah satu library dalam Python yang open source. Pandas digunakan untuk mempermudah dalam mengolah dan menganalisa data-data terstruktur seperti dapat digunakan untuk membuat tabel, mengubah dimensi data, mengecek data, dan lain-lain. Pandas juga berfungsi mengolah data menggunakan teknik join, distinct, group by, agregasi, dll. Selain itu Pandas juga dapat membaca file dengan format seperti .txt, .csv, dan .tsv. Adapun cara mengimport library ini adalah dengan mengetikkan import pandas as pd.
Scikit-Learn merupakan library dalam Python untuk machine learning. Scikit-Learn ini kompatibel dengan library Numpy dan Scipy. Library ini memudahkan kita dalam proses analisis data yang menggunakan algoritma machine learning seperti algoritma regresi, Naive Bayes, Clustering, Decision Tree, Parameter Tuning, Data Preprocessing Tool, Export/Import Model, Machine Learning Pipeline, dan masih banyak lainnya. Adapun algoritma tingkat lanjutnya adalah Metode Ensemble, manipulasi fitur, deteksi outlier, serta pemilihan dan validasi model.
Baca juga : Mulai Belajar Data Science GRATIS bersama DQLab selama 1 Bulan Sekarang!
Berikut adalah beberapa algoritma pengurutan yang populer dalam Python:
Bubble Sort adalah algoritma sederhana yang membandingkan setiap pasangan elemen dan menukarnya jika mereka dalam urutan yang salah. Proses ini diulang hingga tidak ada lagi pertukaran yang diperlukan.
Selection Sort bekerja dengan membagi array menjadi dua bagian: bagian terurut dan tidak terurut. Pada setiap iterasi, elemen terkecil dari bagian tidak terurut dipilih dan dipindahkan ke bagian terurut.
Insertion Sort membangun array terurut satu per satu dengan mengambil elemen dari bagian tidak terurut dan menyisipkannya ke posisi yang tepat dalam bagian terurut.
Merge Sort adalah algoritma pengurutan berbasis pembagian dan penaklukan. Array dibagi menjadi dua bagian, diurutkan secara rekursif, dan kemudian digabungkan kembali.
Quick Sort juga menggunakan pendekatan pembagian dan penaklukan. Elemen pivot dipilih, dan array dibagi menjadi dua sub-array yang berisi elemen yang lebih kecil dan lebih besar dari pivot, yang kemudian diurutkan secara rekursif.
Tim Sort adalah algoritma pengurutan yang digunakan dalam Python dan merupakan gabungan dari Merge Sort dan Insertion Sort. Ini dirancang untuk bekerja dengan baik pada data yang sudah sebagian terurut.
Algoritma pengurutan populer dalam Python termasuk Bubble Sort, Selection Sort, Insertion Sort, Merge Sort, Quick Sort, dan Tim Sort.
Python populer karena bahasa pemrograman ini lebih produktif jika dibandingkan dengan bahasa pemrograman lain seperti C++ dan Java. Penggunaan python juga didukung oleh kesederhanaan sintaks pemrograman, keterbacaan kode, dan perintah seperti bahasa Inggris yang membuat pengkodean dengan python jauh lebih mudah dan efisien.