Pengertian
Adalah proses mengumpulkan data yang telah direkam di World Wide Web, menyimpannya, memastikan data disimpan dalam arsip, dan membuat data yang dikumpulkan tersedia untuk penelitian masa depan. Pengarsipan web adalah proses mengumpulkan data yang telah direkam di World Wide Web, menyimpannya, memastikan data disimpan dalam arsip, dan membuat data yang dikumpulkan tersedia untuk penelitian masa depan. Web Archiving menggunakan pengarsipan web untuk menangkap, melestarikan, dan menyediakan akses ke konten berbasis web. Halaman web semakin dinamis, mereka terus berubah. Untuk memastikan konten ini bertahan untuk generasi berikutnya, konten ini harus ditangkap secara real-time.
Halaman web semakin dinamis, mereka terus berubah. Untuk memastikan konten ini bertahan untuk generasi berikutnya, konten ini harus ditangkap secara real-time. Arsiparis web umumnya mengumpulkan berbagai jenis konten web termasuk halaman HTML Web, style sheet, JavaScript, gambar, dan video. Arsiparsi web menggunakan archive metadata untuk sumber daya yang dikumpulkan seperti access time, MIME type, dan content length. Metadata ini berguna dalam memjaga keaslian dan asal dari koleksi arsip.
Cara Kerja Web Archiving
Remote Harvesting
Menggunakan teknik web crawlers yang secara otomatis melakukan proses pengumpulan halaman web.
Contoh :Heritrix, HTTrack, Wget
On-Demand
Ada banyak layanan yang dapat digunakan sebagai sumber archive web “on-demand”, menggunakan teknik web crawling. Contoh : Aleph Archives, Archive.is, Archive-It, Archivethe.net, Compliance WatchDog by SiteQuest Technologies
Database Archiving
Yaitu metode untuk menarsipkan konten database-driven websites dengan menggunakan ekstraksi konten database ke standard schema, sering menggunakan XML. Setelah disimpan dalam format standar, konten yang diarsipkan dari beberapa databse dapat tersedia untuk diakses dengan menggunakan single access system.
Contoh : DeepArc dan Xinq masiing masing dikembangkan oleh Bibliothèque nationale de France dan National Library of Australia.
Transactional archiving
merupakan event-driven yang mengumpulkan transaksi yang berlangsung antara web server dan web browser, digunakan untuk menjamin keaslian dari isi suatu website, pada tanggal tertentu. Sistem yang digunakan pada transactional archiving biasanya beroperasi dengan memeriksa setiap permintaan HTTP dan respon dari web server, menyaring setiap aktifitas untuk menghilangkan konten yang duplikat dan secara permanen disimpan sebagai bitstreams. Sebuah sistem transactional archiving membutuhkan instalasi perangkat lunak pada web server, dan karena hal itu maka metode ini tidak dapat mengumpulkan konten dari remote website.
Referensi :
http://fryunfirst.blogspot.com/2013/05/web-archiving.html
Komentar
Posting Komentar