Mengapa Ilmu Data Penting?

Dalam posting pertama dari seri kami tentang membangun perusahaan yang diberi informasi data, kami berbagi bahan paling penting yang diperlukan untuk membangun perusahaan yang diberi informasi: fokus tunggal pada dampak dan membangun budaya yang berdasarkan data. Dalam posting kedua ini, kita akan fokus pada mengapa ilmu data penting dan membahas masa depan ilmu data dalam konteks membangun produk.

Apa sebenarnya ilmu data itu? Ilmu data adalah disiplin ilmu dan pencarian kebenaran yang menggunakan data untuk mengekstrak pengetahuan dan wawasan. Ilmu data adalah salah satu fungsi yang paling cepat berkembang dan sudah memberikan nilai luar biasa di setiap industri dan bidang studi. Namun demikian, ilmu data masih dalam masa pertumbuhan dan seperti halnya bidang yang sedang berkembang, sering kali tergoda untuk menempatkan batasan-batasan di sekitar definisinya. Daripada mengkategorikan apa yang tidak atau tidak dihitung sebagai ilmu data atau berdebat tentang mengapa kita harus memiliki data tetapi tidak didorong oleh data, kami percaya bahwa yang paling penting adalah memberikan ruang bagi disiplin untuk berkembang secara organik.

MENGAPA ILMU DATA MASALAH?

Memulai perusahaan teknologi, membangun produk yang bagus, dan mendapatkan daya tarik menjadi lebih mudah berkat peningkatan konektivitas, penurunan penyimpanan cloud, dan biaya komputasi, dan aksesibilitas platform distribusi untuk mencapai target audiens. Akibatnya, waktu yang dibutuhkan suatu produk untuk mencapai 100 juta pengguna aktif bulanan telah memendek secara dramatis, dan terus menyusut hingga hari ini. Misalnya, butuh sekitar 100 bulan bagi iTunes untuk mencapai 100 juta pengguna aktif bulanan pada tahun 2003 dan hanya beberapa hari bagi Pokemon Go untuk melakukan hal yang sama. Bagan di bawah ini memiliki beberapa contoh yang lebih baik, dimulai dengan telepon.

Kombinasi lebih banyak produk yang dibangun, lebih banyak perangkat yang terhubung ke Internet yang dibeli, dan peningkatan waktu yang dihabiskan secara online telah menyebabkan lonjakan volume data interaksi pengguna. Telah ada minat yang luar biasa dalam menambang data ini dan mendapatkan wawasan kunci untuk membantu membangun produk-produk hebat. Kemampuan perusahaan untuk bersaing sekarang diukur dari seberapa suksesnya ia menerapkan analitik pada kumpulan data yang luas dan tidak terstruktur di berbagai sumber yang berbeda untuk mendorong inovasi produk. Oleh karena itu, para ilmuwan data sangat dibutuhkan, dan bahwa tim ilmuwan data cerdas dapat membuat atau menghancurkan suatu produk.

Minat yang meningkat pada data pertambangan untuk wawasan ini telah menyebabkan tim produk menggunakan data untuk fokus pada empat hasil spesifik.

  1. Mengevaluasi kesehatan bisnis: Salah satu hasil utama dari analisis produk adalah untuk mengevaluasi kesehatan suatu produk atau bisnis. Setelah kami mendefinisikan kesuksesan produk dengan tujuan dan metrik, langkah selanjutnya adalah memantau metrik untuk memastikan bahwa kami berada di jalur yang tepat untuk mencapai sasaran. Secara taktik, analis bekerja untuk mengidentifikasi pencilan, memahami pendorong perubahan metrik, membuat dashboard / laporan / visualisasi dll.
  2. Kirimkan produk dan fitur yang tepat: Peran analitik lain yang sangat penting adalah untuk memastikan bahwa produk dan fitur yang tepat dapat dibangun. Banyak perusahaan menjalankan banyak percobaan dan mengirimkan produk setelah mengevaluasi hasil percobaan ini. Biasanya para ilmuwan data membantu merancang eksperimen, mengidentifikasi hipotesis berdasarkan informasi tentang fenomena, dan memandu tim produk tentang optimalisasi konstan produk melalui wawasan data.
  3. Hasil perkiraan dan sistem produksi daya - Peran lain dari ilmuwan data adalah membangun prototipe / model dan sistem produksi daya menggunakan AI / ML. Para ilmuwan data ini melatih model pembelajaran mesin dari suatu fenomena untuk memperkirakan ekspektasi dan tren masa depan.
  4. Tetapkan roadmap dan strategi untuk produk: Eksplorasi dan analisis yang lebih dalam dari perjalanan pengguna dan fenomena menghasilkan wawasan yang dapat ditindaklanjuti yang pada akhirnya menghasilkan pengaturan roadmap dan strategi untuk produk. Peta jalan dan strategi yang didorong oleh data adalah salah satu hasil terpenting dari tim analisis produk kelas dunia.

Keempat hasil ini secara khusus mengarah pada dua jenis ilmuwan data yang berbeda di industri - analis produk dan pengembang algoritma.

APA YANG DILAKUKAN PARA ILMU DATA?

Judul ilmuwan data mencakup berbagai peran yang sangat bervariasi di berbagai perusahaan dan industri. Yang mengatakan, secara umum ada dua kubu utama ilmuwan data:

  1. Analis produk, yang berperan untuk menyampaikan cerita yang diinformasikan data yang mendukung perubahan produk atau strategi. E.g., Sistem pengiriman pemberitahuan SMS kami rusak di India. Akibatnya, kita perlu fokus pada peningkatan notifikasi SMS di India, yang akan membantu menyalakan kembali pertumbuhan.
  2. Pengembang algoritma, yang berperan untuk menggabungkan fitur berbasis data ke dalam produk (mis., Mengoptimalkan rekomendasi atau hasil pencarian). Misalnya. Tingkat penipuan di Indonesia telah meningkat. Bangun model baru yang berfokus pada tren penipuan baru-baru ini di Indonesia.

Analis produk fokus pada penetapan tujuan dan menginformasikan peta jalan dan strategi produk. Mereka membantu meningkatkan produk dengan mengevaluasi dan memahami kesehatan mereka dan memberikan keputusan produk (sebagian besar melalui eksperimen). Hasil umum dari analis produk adalah dokumen kepada tim produk yang menceritakan masalah yang dapat dikuantifikasi, peluang yang teridentifikasi, dan rekomendasi serta solusi berbasis data.

Pekerjaan utama pengembang algoritma adalah memanfaatkan data untuk meningkatkan kinerja produk dalam mengejar tujuan akhir tertentu, biasanya memperkirakan hasil atau membangun sistem produksi. Pengembang algoritma umumnya menggunakan pembelajaran mesin dan teknik algoritmik kompleks lainnya untuk membuat prediksi berdasarkan input dari sejumlah besar data. Secara umum, pengembang algoritma membuat prototipe solusi yang diusulkan dan bekerja sama dengan tim teknik untuk mengimplementasikannya dalam produksi. Hasil dari pengembang algoritma adalah kode prototip dan dokumentasi yang disediakan untuk tim teknik.

Sementara kedua jenis data ilmuwan memerlukan pandangan analitis, keterampilan kuantitatif, dan kemampuan untuk memprioritaskan, jarang menemukan seseorang yang dapat memenuhi kedua peran tersebut. Pengembang algoritma membutuhkan pengetahuan teknis yang lebih canggih, seperti pembelajaran mesin dan kecerdasan buatan, dan tingkat keterampilan rekayasa perangkat lunak yang lebih dekat dengan keahlian para insinyur. Analis produk terutama adalah pemecah masalah yang dibedakan berdasarkan bisnis, produk, dan kemampuan mereka untuk berkomunikasi secara efektif dengan berbagai pemangku kepentingan.

Meskipun hanya beberapa organisasi yang membutuhkan pengembang algoritma, semua perusahaan, terutama yang memiliki basis pengguna yang signifikan, mendapat manfaat dari analis produk yang dapat membantu menavigasi produk, kompetitif, dan tantangan strategis lainnya. Nanti dalam rangkaian posting blog ini, kami akan memberikan panduan tambahan tentang perekrutan, pelatihan, pembinaan, dan pengelolaan analis produk sehingga mereka dapat berkontribusi pada level tertinggi.

Jadi, apakah perusahaan perlu merekrut pengembang algoritma dan menjadi lebih banyak data-didorong atau haruskah mereka mempekerjakan analis produk dan lebih banyak informasi-data? Hasil murni didorong oleh data saat data adalah satu-satunya sinyal yang diperlukan untuk membuat keputusan. Sebaliknya, dalam keputusan berdasarkan informasi, data merupakan input yang kuat tetapi bukan satu-satunya input. Secara umum, Analis Produk adalah data-informasi dan pengembang algoritma didorong oleh data.

EVOLUSI ILMU DATA

Bayangkan sebuah dunia di mana mesin mengetahui segala sesuatu tentang Anda dan dapat berbelanja untuk Anda tanpa meminta secara eksplisit; tahu makanan yang Anda sukai dan memasak untuk Anda; tahu pilihan Anda dan dapat membuat keputusan untuk Anda dan tahu apa yang baik untuk Anda dan merencanakan hidup Anda. Dunia ini jauh ke masa depan dan membutuhkan Kecerdasan Buatan untuk mengambil alih sebagian besar hidup kita. Bagi kita untuk membuat kemajuan menuju mimpi ini, kita perlu menjadi lebih didorong oleh data.

Di dunia yang sempurna dengan informasi yang sempurna dan pemahaman lengkap tentang semua driver sistem Anda dan bagaimana mereka saling berinteraksi, kedua pendekatan ini akan bertemu. Untuk membangun model yang sempurna, fenomena yang diteliti perlu dipahami sepenuhnya; hubungan antara data dan fenomena dapat dijelaskan oleh model yang sempurna (dan set fitur kaya yang terkait). Untuk berkembang ke tingkat kesempurnaan ini dan juga membuat kemajuan untuk sementara, dunia perlu terus membuat kemajuan dalam pengambilan keputusan berdasarkan informasi. Yaitu, kita perlu terus menambah pengambilan keputusan kita dengan langkah-langkah subjektif lainnya yang belum dapat dengan mudah dikuantifikasi sepenuhnya. Ketika kita mulai memiliki pemahaman yang lebih dalam tentang hubungan antar objek, semakin banyak proses yang akan diautomatiskan dan masa depan akan lebih banyak didorong oleh data daripada data yang diinformasikan. Namun, pengambilan keputusan berdasarkan informasi akan terus menjadi sangat penting untuk beberapa dekade mendatang dan pengambilan keputusan berdasarkan data hanya akan meningkat dengan kemajuan dari orang-orang yang memiliki informasi tentang data.

Sangat ilustratif untuk memahami perbedaan antara pengambilan keputusan berdasarkan informasi dan pengambilan keputusan berdasarkan data melalui contoh-contoh.

  • Menentukan tujuan. Tujuan yang baik dapat diukur dan diukur. Mampu mengidentifikasi dan melacak tujuan akan semakin didorong oleh data. Misalnya, pelacakan Facebook terhadap pengguna aktifnya mungkin sepenuhnya otomatis. Namun, menetapkan sasaran triwulanan dan tahunan yang tepat untuk pengguna aktif dan pendapatan mungkin hanya sebagian terotomatisasi dan akan terus diberi informasi data.
  • Menentukan peta jalan dan strategi. Menetapkan peta jalan dan strategi tidak kuantitatif dan karenanya memerlukan pendekatan informasi-data. Misalnya, dengan menggunakan data, peta jalan dapat dikembangkan untuk meningkatkan penggunaan aktif harian dengan berfokus pada pemberitahuan SMS. Roadmap yang baik mempertimbangkan tujuan yang relevan, pendorong tujuan ini, tuas yang dimiliki tim produk, dan semua tindakan yang dapat diambil. Sebagian besar dari ini bersifat kualitatif, sehingga proses membangun peta jalan dan menentukan strategi terutama didasarkan pada data.
  • Meramalkan hasil. Hasil peramalan sebagian besar didorong oleh data. Misalnya, mencari tahu apakah akan menampilkan cerita atau tidak kepada pengguna akan membutuhkan pemahaman beberapa faktor, termasuk kemungkinan pengguna mengklik atau membaca cerita itu. Perusahaan biasanya mengembangkan model, yang diulang terus menerus, untuk memperkirakan hasil spesifik ini.
  • Menggerakkan sistem produksi. Bagi perusahaan seperti PayPal untuk mengidentifikasi aktivitas penipuan dari setiap transaksi, sangatlah mahal untuk melakukan ini secara manual untuk semua transaksi. Akibatnya, mereka sebagian besar mengandalkan pembelajaran mesin untuk menyalakan sistem produksi mereka dan mengotomatiskan perhitungan kemungkinan transaksi menjadi buruk. Banyak pengambilan keputusan yang mengikuti evaluasi probabilitas juga dilakukan secara otomatis. Namun, di daerah-daerah di mana ada tingkat kepercayaan yang lebih rendah dalam evaluasi probabilitas, proses pengambilan keputusan dapat diinformasikan data.

TAKEAWAY

  • Meningkatkan produk dan menghasilkan uang melalui data telah menjadi keunggulan kompetitif dalam beberapa tahun terakhir. Organisasi data yang kuat dan terorganisir dengan baik adalah pembeda yang kuat.
  • Ilmuwan data mendorong keputusan produk utama di seluruh perusahaan dan membangun algoritma generasi berikutnya untuk meningkatkan pengambilan keputusan.
  • Dunia akan terus menjadi semakin didorong oleh data, tetapi pengambilan keputusan berdasarkan informasi akan tetap relevan.

Karya ini adalah produk dari tim Ilmu Data Sequoia Capital. Chandra Narayanan, Hem Wadhar dan Ahry Jeon menulis posting ini. Lihat seri ilmu data lengkap di sini. Silakan email data-science@afteroiacap.com dengan pertanyaan, komentar, dan umpan balik lainnya.

Kisah ini diterbitkan dalam The Startup, publikasi kewirausahaan terbesar Menengah diikuti oleh +432.678 orang.

Berlangganan untuk menerima berita utama kami di sini.