Web Archiving



 

Kesimpulan :

Web Archiving adalah proses mengumpulkan bagian dari World Wide Web agar memastikan koleksi tersebut diawetkan dalam suatu arsip untuk diakses peneliti, sejarawan, dan masyarakat umum pada masa yang akan datang. Organisasi pengarsip web terbesar yang menggunakan rancangan perangkat web ini adalah Internet Archive yang berupaya pemeliharaan arsip dari seluruh Web.

 

Arsiparis web umumnya mengumpulkan berbagai jenis konten web termasuk halaman HTML Web, style sheet, JavaScript, gambar, dan video. Arsiparsi web menggunakan archive metadata untuk sumber daya yang dikumpulkan seperti access time, MIME type, dan content length. Metadata ini berguna dalam memjaga keaslian dan asal dari koleksi arsip. Adapun cara kerja Web Archiving adalah dengan Remote Harvesting, On-Demand, Database dan Transactional archiving.

 

Metode pengumpulan dapat dilakukan dengan beberapa cara, yaitu :

 

Panen Jarak Jauh

Yaitu teknik pengarsipan dengan menggunakan web crawler untuk mengoptimalisasi proses pengumpulan halaman web.

 

Database Pengarsipan

Yaitu metode pengarsipan konten berdasarkan database-driven website, yang memerlukan ekstraksi dari isi database ke skema standar dengan menggunakan XML.

 

Transaksional Pengarsipan

adalah sebuah pendekatan event-driven, dengan mengumpulkan transaksi yang terjadi antara web server dan browser web.

 

Adapun Kesulitan dan keterbatasan pada Web Archiving Protokol pengecualian robot yang dapat meminta crawler tidak dapat mengakses bagian dari sebuah situs web Sehingga Sebagian besar dari sebuah situs web mungkin tersembunyi di dalam Web. Protokol pengecualian robot yang dapat meminta crawler tidak dapat mengakses bagian dari sebuah situs web Sehingga Sebagian besar dari sebuah situs web mungkin tersembunyi di dalam Web. mengelabui mesin pencari untuk mengarahkan lalu lintas pengguna ke situs Web dan sering dilakukan untuk menghindari akuntabilitas, atau untuk menyediakan konten ditingkatkan hanya kepada browser yang dapat menampilkannya.

 

Agar kurasi web seperti kurasi digital dapat dilakukan, kita perlu untuk Sertifikasi dari kepercayaan dan integritas dari isi koleksi, Mengumpulkan aset Web diverifikasi, Menyediakan Web pencarian aset dan pengambilan, Semantik dan ontologis kontinuitas dan komparatif dari isi koleksi. Dengan demikian, selain membahas metode pengumpulan Web, harus juga menyertakan akses, sertifikasi, dan pengorganisasian.

 

Komentar