Selasa, 18 November 2008

Metoda Statistika terbaru dan canggih

Bagaimana anda menyaring milliaran bit informasi dan membuat kesimpulan yang akurat dari sejumlah data yang sanagt besar ? Charles “chip” Lawrence, seorang ahli matematika universitas brown dan Luis Carvalho, seorang sarjana telah menemukan jawaban yang “segar” yang bisa diterapkan secara luas pada sains, teknologi dan bisnis.

Dalam proceeding terbaru akademi nasional sains,
Lawrence dan carvalho menggambarkan sejenis alat estimasi statiska terbaru dan membuktikan empat teorema berkenaan dengan kerja ini. hasilnya menunjukkan bahwa alat-alat estimasi “centroid” ini menghasilkan prediksi statistika yang lebih baik dan memberikan jalan untuk mengekstraksi informasi dari susunan data yang sangat besar dibidang biologi komputasi, teknologi informasi, perbankan dan keuanagn, kedokteran dan teknik.

“betapa menakjubkan kerja ini - yang merupakan mimpi setiap ilmuwan-, dan ini betul-betul sangat penting,” kata Lawrence. “Alat estimasi data ini dapat diaplikasikan dalam biologi dan yang lainnya, dan membuat lebih maju metoda statistika dibanding sebelumnya.

Selama lebih dari 80 tahun, satu dari banyak metoda statistika telah dipakai secara maksimu yaitu MLE (maximum likelihood estimation). Metoda ini dipakai untuk mendapatkan satu solusi yang sangat mungkin, atau perkiraan, dari sejumlah data.

tetapi teknologi terbaru yang menangkap sejumlah besar data- “Human genome sequencing”, jejak transaksi internet, benda-benda bersinar dengan gambar beresolusi tinggi dari luar angkasa- telah membuka kesempatan untuk memprediksi “dimensi puncak” dari ciri-ciri tersebut atau “High - D Unknown”. Sejumlah besar kombinasi “High - D Unknown” ini menghasilkan ketidakpastian statistika yang sangat besar. Data memiliki analisis yang lebih tinggi.

Ketidaksesuaian ini menghasilkan paradox. alih-alih menghasilkan prediksi yang tepat tentang aktivitas gen, kebiasaan berbelanja atau kehadiran dari bintang-bintang yang jauh ; Sejumlah data besar ini akan menghasilkan prediksi yang lebih terpercaya, dan prosedur terbaik yang diberikan. hal ini disebabkan MLE memakai data untuk mengidentifikasi satu data solusi yang sangat terpercaya. Tetapi dikarenakan tiap satu poin data berenang dalam suatu samudra luas yang meningkat, menjadikannya tidak mungkin untuk menjadi representatif.

lawrence, seorang profesor matematika terapan dan anggota fakultas dalam pusat Biologi Molekuler komputasi di brown University, pertama kali menghadirkan paradox ini dan sebuah cara potensial disekelilingnya ketika bekerja memprediksi molekul struktur RNA . Jika anda ingin memprediksi struktur dari molekul tersebut-betapapun molekul itu akan kelihatan ketika molekul itu melipat dirinya-kau akan memiliki milliaran bentuk yang mungkin yang akan kau pilih darinya.

“Pemakaian MLE sangat mungkin menghasilkan hasil yang tidak bisa dipercaya” Demikian kata Lawarence,” jadi, kita memerlukan metode estimasi (peramalan) yang lebih baik”.

lawrence dan carvalho memakai “teori keputusan Statistika” untuk memahami batasan dari prosedur lama ketika berhadapan dengan problem “High-D” terbaru. Mereka juga memakai “teori membuat-keputusan Statistika” untuk mendapatkan prosedur peramalan yang dapat diaplikasikan dalam beragam problem statistika yang lebih luas. Alat estimasi “centroid” ini mengidentifikasi tidak hanya satu solusi yang sangat mungkin, melainkan juga sebagai solusi yang sangat mewakili dari semua perangkat data.

lawrence and Carvalho meneruskan untuk membuktikan empat teoremanya yang melukiskan bahwa properti-properti yang menyenangkan dari alat estimator ini dan menunjukkan bahwa mereka bisa lebih mudah untuk mengkomputasi dalam beragam applikasi yang penting.

“Prosedur terbaru ini lebih menguntungkan di beragam bidang yang memerlukan ketepatan peramalan skala besar, “High-D unknown” Demikian kata lawrence.


sumber : Science Daily (original ver.) Dzulfikar (terjemahan)

1 komentar:

Anonim mengatakan...

PST ya? hmmm...salah 1 divisi favoritku dulu.:) perkenalkan aq arek statistik 05, kunjungi juga blog "pencari uang" milikku di www.statisticsanalyst.wordpress.com