Kesimpulan :
Web Archiving adalah proses
mengumpulkan bagian dari World Wide Web agar memastikan koleksi tersebut
diawetkan dalam suatu arsip untuk diakses peneliti, sejarawan, dan masyarakat
umum pada masa yang akan datang. Organisasi pengarsip web terbesar yang menggunakan
rancangan perangkat web ini adalah Internet Archive yang berupaya pemeliharaan
arsip dari seluruh Web.
Arsiparis web umumnya mengumpulkan
berbagai jenis konten web termasuk halaman HTML Web, style sheet, JavaScript,
gambar, dan video. Arsiparsi web menggunakan archive metadata untuk sumber daya
yang dikumpulkan seperti access time, MIME type, dan content length. Metadata
ini berguna dalam memjaga keaslian dan asal dari koleksi arsip. Adapun cara
kerja Web Archiving adalah dengan Remote Harvesting, On-Demand, Database
dan Transactional archiving.
Metode pengumpulan dapat dilakukan
dengan beberapa cara, yaitu :
Panen Jarak Jauh
Yaitu teknik pengarsipan dengan
menggunakan web crawler untuk mengoptimalisasi proses pengumpulan halaman web.
Database Pengarsipan
Yaitu metode pengarsipan konten
berdasarkan database-driven website, yang memerlukan ekstraksi dari isi
database ke skema standar dengan menggunakan XML.
Transaksional Pengarsipan
adalah sebuah pendekatan
event-driven, dengan mengumpulkan transaksi yang terjadi antara web server dan
browser web.
Adapun Kesulitan dan keterbatasan
pada Web Archiving Protokol pengecualian robot yang dapat meminta crawler tidak
dapat mengakses bagian dari sebuah situs web Sehingga Sebagian besar dari
sebuah situs web mungkin tersembunyi di dalam Web. Protokol pengecualian robot
yang dapat meminta crawler tidak dapat mengakses bagian dari sebuah situs web
Sehingga Sebagian besar dari sebuah situs web mungkin tersembunyi di dalam Web.
mengelabui mesin pencari untuk mengarahkan lalu lintas pengguna ke situs Web
dan sering dilakukan untuk menghindari akuntabilitas, atau untuk menyediakan
konten ditingkatkan hanya kepada browser yang dapat menampilkannya.
Agar kurasi web seperti kurasi
digital dapat dilakukan, kita perlu untuk Sertifikasi dari kepercayaan dan
integritas dari isi koleksi, Mengumpulkan aset Web diverifikasi, Menyediakan
Web pencarian aset dan pengambilan, Semantik dan ontologis kontinuitas dan
komparatif dari isi koleksi. Dengan demikian, selain membahas metode
pengumpulan Web, harus juga menyertakan akses, sertifikasi, dan
pengorganisasian.
Komentar
Posting Komentar