Leap Logo

Benarkah Auto Machine Learning Mengancam Profesi Seorang Data Scientist?

LP

Leap by Telkom

21 Oct 2022 13.30 WIB

portrait

Dahulu, bidang Data Scientist belum banyak digemari oleh wanita. Tetapi Ananda Dwi Putri berpikir berbeda saat ia mendapat kesempatan bekerja di salah satu perusahaan multinasional usai menamatkan kuliahnya di tahun 2018. Pekerjaan perdana yang ia jalani justru sebagai data analis. Berbekal dari pengalaman ini ketika akhirnya ia lolos Great People Trainee Program (GPTP) X Telkom setahun kemudian, ia mantap memilih Data Scientist di chapter DSC.

Ternyata, Nanda sudah lama tertarik dengan matematika dan perkodingan. Bahkan, selain bergelar S.SI, ia juga memperoleh gelar minor teknik informatika.

“Pertama kali di DSC kan masuk tahun 2019 saat itu data scientist perempuan masih bisa dihitung jari. Kebanyakan mereka di manajerial sementara untuk teknikal kebanyakan laki-laki. Saya terinspirasi dari kakak saya sebetulnya, dia jurusan sistem informasi. Saya suka baca buku-buku kuliah kakak, kok kayaknya enak nih, programming dan sebagainya. Kebetulan kan saya dapatnya matematika, lalu saya ambil minornya informatika saja. Lagipula, menurut saya matematika itu abstrak banget, nah kalau programming kan ada program nyatanya, jadi kepakai di Data Scientist,” ungkap Nanda.

Role and Responsibility & Usecase

Kini, Nanda merupakan Junior Data Scientist di chapter DSC dan dedicated ke Tribe BigData sebagai Head of Legal Analytics Data Scientist, membawahi role Data Scientist, “peran saya adalah sebagai Data Scientist in general, in particular AI Engineer. Lebih spesifik lagi Lead of AI and Research dan baru saja mendapat mandat sebagai Head of Legal Data Scientist di Legal Analytics Telkom Indonesia”.

Secara struktural, Nanda di-assign ke Tribe Big Data & Smart Platform (BSP) dan berfokus di Squad Legal Analytics. Menurutnya, Legal Analytics merupakan startup company yang mengusung data-driven Legal Culture dan Legal Technology. Tidak hanya bertanggung jawab sebagai Data Scientist, Ia juga melakukan riset AI Solution. Plus, bertanggungjawab sebagai leader tim Data Scientist di Legal Analytics.

Secara garis besar, peran yang ia emban adalah membangun reproducible model workflow yang selanjutnya deploying machine learning pipeline tersebut ke tahap production. Kemudian, secara paralel juga memanage tim Data Scientist terhadap tugas-tugasnya. Di samping itu, ia juga melakukan riset dan development arsitektur model khususnya pada Natural Language Processing demi menunjang Legal Technology.

Nanda mengawali pengalamannya di Chapter DSC dengan terlibat dalam desain project big data appliance Pegadaian. Tugasnya yaitu mengolah data structure yang berikan dengan angka atau numerik. Ia merasa bahwa ini adalah pekerjaan basic seorang Data Scientist. Project yang ia kerjakan saat itu merupakan modelling untuk produk-produk Pegadaian. Bisa dibilang, Nanda cukup keteteran menyesuaikan tools dan platform yang selama kuliah dipelajari ternyata berbeda dengan saat bekerja.

Baca juga: Ruang Kontribusi itu Bernama AGI

“Misal untuk Pegadaian saat itu kebetulan memakai Cloudera Data Scientist Workbench yang sebelumnya belum pernah saya pakai sama sekali. Nah, di sini saya merasa pokoknya mungkin satu hari itu kurang kayaknya 24 jam, karena kita sambil belajar sambil mengerjakan pekerjaan juga kan. Belajar sendiri. Untungnya saat project Pegadaian itu beberapa tim dari DSC ada yang sudah senior, jadi dia membantu saya dan mengajari step by step-nya seperti apa. Setidaknya, diberi arahan dan selebihnya memang kita harus berusaha sendiri dan tidak boleh bergantung kepada orang lain, karena masing-masing juga memiliki tanggung jawab kerja kan?,” kata Nanda.

Saat itu, Nanda dipercaya sebagai data modeler yaitu membangun predictive model Cross Sell dan Up Sell produk-produk Pegadaian dengan tree-based model seperti Decision Tress, Random Forest, Gradient Boosting Tree, dan XGBoost. Semua model ini dikembangkan kepada Spark Environment dengan Spark-ML.

Setelah selesai mengerjakan project Pegadaian, ia lanjut mengerjakan project Intermoda dan terlibat pada Proof of Concept (POC) untuk menganalisa data rute travel di berbagai moda transportasi seperti MRT, LRT, dan lain-lain. Lalu, ia juga mengerjakan Project Kementerian Sekretariat Negara, dimana terdapat beberapa usecase, seperti pembuatan Perancangan Undang-Undang (PUU) Dashboard yang merupakan Artificial Intelligence (AI) platform untuk planning, drafting, dan analisis peraturan perundang-undangan. Ranah kerja Nanda meliputi RPUU Data Tracking System, Alerting System for PUU Reminder, RPUU DOcument Setting, RPUU Document Analytics, dan PUU Search & Analytics.

“Di sini saya bertugas membangun model transformers khusus bahasa untuk perundang-undangan, PUU-BERT, dan PUU-RoBERTa. Model ini adalah model transformers pertama di Indonesia yang di-training khusus pada data PUU. Nah, model ini juga digunakan sebagai base model untuk analisis teks PUU. Beberapa usecase yang saya kerjakan adalah Semantic Text Similarity atau STS untuk menentukan harmonisasi undang-undang, juga Question Answering untuk chatbot terkait legislasi. Keduanya ini menggunakan PUU-BERT dan PUU RoBERTa. Selain itu, saya juga build Speech-to-Text model, dan Text-to-Speech Animation Lip Sync model dengan Generative Adversarial Network atau yang biasa disingkat GAN untuk membantu rapat perancangan undang-undang,” papar Nanda.

Masih di project Kementerian Sekretariat Negara, Nanda pun mengerjakan project terkait Pengaduan Masyarakat. Project ini ditujukkan untuk digitalisasi, monitoring, analisis, dan platform integrasi pengaduan masyarakat (DuMas). Pada project ini, Nanda melakukan unsupervised classification model Pengaduan Masyarakat dan Whatsapp Chatbot, atau aplikasi Presidential Complaint Handling System. Yang tidak kalah penting, ia pun terlibat dalam Project Satria Dewa yang berkaitan dengan Agenda Kepresidenan. Nanda mengerjakan model prediksi dampak acara atau kegiatan presiden berdasarkan data sosial media.

Baca juga: Bagaimana LKPP Bersama Telkom Membentengi Uang Negara

“Selain yang tadi, saya juga sempat mengerjakan Project Kejaksaan Agung. Di sini saya mengerjakan model untuk klasifikasi pidana khusus, prediksi entitas lembaga, dan model klasifikasi sektor yang digunakan untuk pencegahan tindak pidana dan penindakan perkara. Lalu, memberikan rekomendasi sebagai upaya pencegahan terjadinya tindak pidana korupsi. Kemudian, usecase atau project lainnya adalah implementasi Legal Analytics di berbagai instansi seperti Telkom Legal Informasi System atau TELIS, Kementerian Perhubungan, dan Social Media Analytics yang masih saya kerjakan sampai sekarang,” tambah dia.

Challenge & Opportunity di Telkom

Bagi Nanda, setiap project baru merupakan sebuah tantangan. Ketika berhasil ditaklukkan, hadir kepuasan tersendiri. Sementara untuk saat ini, ia merasakan bahwa apa yang dikerjakannya mengenai Pengaduan Masyarakat begitu menantang.

Baca juga: Tantangan Seorang Designer di Ranah Logistik dalam Mendefinisikan Digital Product dan Objective Key Result

“Sebenarnya, ini bukan masalah kerjaan saja sih, karena saya juga ingin membantu proses ini supaya bisa di-otomasi memakai model atau bot. Nah, sekarang itu kita bikin integrasi whatsapp dan platform untuk pengaduan masyarakat. Jadi yang eksisting sekarang itu kan masih sporadis, kadang pengaduan ada di Twitter, Sosial Media, yang akun adminnya dipegang oleh Setneg. Ke depan arahnya akan menggunakan WA dan di dalam WA itu sudah ada chatbot. Sehingga kalau masyarakat mau mengadu langsung ke Presiden atau lembaga-embara di bawah Kementerian terkait itu memungkinkan. Nanti, Kementerian Sekretariat Negara akan follow up ke Kementerian terkait, atau badan, atau provinsi. Tantangannya tuh di sini kalau untuk chatbot service yang berbayar memang sudah banyak berkeliaran di internet, tapi di sini kita benar-benar bikin dari nol. Karena kasusnya ini sudah custom banget dan data-datanya juga tidak boleh keluar kemana-mana, jadi arsitekturnya benar-benar kita yang bikin. Jadi memang from scratch itu, trial, testing, trial, error… ya memang menantang banget. Tapi semoga jadi deh!,” kata Nanda optimis.

Nanda merasa sangat bersyukur karena mendapat banyak pengalaman dan portofolio selama berada di Telkom. Terlebih, Telkom sangat memfasilitasi dirinya untuk berkembang dan menggapai ilmu-ilmu baru. Menurutnya, kesempatan belajar dan berkembang di Telkom sangat terbuka lebar bagi dirinya. Di setiap kuartal, Nanda mendapat kesempatan untuk mengambil pelatihan yang dibutuhkan untuk up skill, setidaknya ia sendiri mengambil minimal 2 online course profesional.

“Wah, ini thanks to Corpu sih sebetulnya! Jadi, Corpu-Corpu kan kaya dijatahin gitu per kuartal untuk training semau kita, nah saya memanfaatkan dong. Setiap kuartal paling enggak minimal ada dua online course yang saya ikuti, dan sekarang juga masih on going. Seperti pelatihan sebagai fasilitator cloud atau AWS sama yang online sekarang saya ambil course profesionalnya Stanford NLP yang semua dibiayai Corpu, alhamdulillah. Kenapa saya pilih kelas internasional profesional Stanford ini karena kebanyakan tuh arsitektur language model bahasa yang NPL ini. Stanford juaranya sih, dan saya penasaran dengan pola pikir teori-teorinya, cara mereka membuat seperti apa. Jadi saya mengambil beberapa kelas di situ, mesti tidak murah alhamdulillah dibiayai oleh Telkom,” serunya girang.

Selain gemar mengikuti berbagai kursus dan pelatihan, Nanda juga hobi mantengin Twitter dan mengikuti konferensi internasional. Lagi-lagi, ia mengucap terima kasih kepada Telkom yang membiayai dan memberinya kesempatan menjadi perwakilan Telkom untuk Konferensi Learning Representation. Konferensi ini memaparkan beberapa model-model terbaru Machine Learning. Di situlah bagi Nanda kesempatan untuk melihat orang-orang hebat melakukan presentasi dan memaparkan model-modelnya. Sembari melihat mereka presentasi, dalam hati Nanda mengukur dan menimbang dirinya sudah berada di step mana.

Menurut Nanda dengan hobi ini, ia dapat menemukan informasi mana yang excecution time runnning-nya lebih singkat, resourcenya lebih sedikit, namun performance-nya tidak jauh berbeda dengan yang running-nya memakan waktu, “Jadi kepake banget tuh misal kalau bisa resource yang kita pakai seefektif mungkin. Ini juga bisa menjadi perbendaharaan model kita juga, agar kita selalu up to date dengan teknologi yang ada sekarang. Pergantiannya soalnya cepat sekali, mungkin satu tahun model ini masih wow banget, tapi tahun depan sudah ada saingan yang mengalahkan performance model sebelumnya”.

Baca juga: Tantangan Social Media Specialist dalam Membangun Penjenamaan Produk Digital Telkom

Data Scientist VS Auto Machine Learning

Nanda mengungkapkan jika tantangan nyata seorang data scientist sesungguhnya adalah Auto Machine Learning.

“Tantangan sesungguhnya adalah Auto Machine Learning (ML). Jadi, kita tidak usah mikir apa-apa tinggal masukkan data, dan hasilnya keluar. Outputnya sudah jadi seolah-olah nantinya profesi Data Scientist tidak akan terlalu butuh banyak orang, yang tadinya tim bisa beberapa orang, jadi hanya satu saja untuk nurunin Auto ML-nya. Makanya sekarang auto ML itu masih sebatas model-model sederhana. Tetapi, siapa tahu kan besok-besok sudah sampai ke model-model yang advance? Seperti yang sudah-sudah, manusia bakal digantikan oleh robot. Jadi, penting banget kita sebagai seorang data scientist memiliki value agar tidak digantikan oleh robot,” tegas pemenang Tim Innovator dari Incubator Telkom Indonesia pada event yang diselenggarakan Setneg X Innovation Awards.

Meskipun begitu, Nanda tetap percaya bahwa di mesin running, seorang data scientist tidak sekedar bertugas membuat model semata. Hal terpenting tugas pokok manusia adalah mengorkestrasi. Sehingga muncullah ML Devops semacam orkestrasi dari awal hingga ujung, dari raw material sampai sudah menjadi produk jadi. “Jadi saya sekarang juga bermain di arena sana juga, mempelajari ML devops atau plot sudah main ke cloud AWS, dan lain-lain. Jadi, ketika nanti profesi Data Scientist tergantikan oleh robot, saya punya skill lain yang bisa saya juga, bukan hanya sekedar modelling, tetapi juga ML devops itu tadi,” pungkas Nanda.

Leapers, tertarik di bidang data seperti Nanda? Yuk gabung bersama kami dan cari peluangnya dengan klik button di bawah ini!

Masih penasaran dengan cerita lainnya? kunjungi medium kami dan follow untuk mengikuti keseruan lainnya!

Formulir Pertanyaan