วันจันทร์ที่ 13 ตุลาคม พ.ศ. 2557

เราจะสามารถเก็บข้อมูลไว้ตลอดไปได้หรือไม่ perpetual data archiving

การเก็บข้อมูลไว้เผื่อใช้ในอนาคตเป็นเรื่องที่หลายคนเห็นความสำคัญ ไม่ว่าจะเป็นข้อมูลทางวิทยาศาสตร์ ศิลปะวัฒนธรรม หรือ เหตุการณ์ทางสังคม ปัญหาคือสื่อบันทึกข้อมูลมีอายุการใช้งานจำกัด เพราะเราไม่ได้พูดถึงระยะเวลาแค่ปีหรือสองปี แต่ยาวนานเป็นสิบปี หรือ ตลอดไป

นอกจากสื่อบันทึกข้อมูลจะมีการเสื่อมสภาพ อุปกรณ์ในการเขียนอ่านข้อมูลก็มีการเสื่อมสภาพ และ เทคโนโลยีมีการเปลี่ยนแปลงอย่างรวดเร็ว ตอนนี้หากใครมีข้อมูลในฟลอปปี้ดิสค์ ก็อาจจะหาเครื่องอ่านข้อมูลออกมาได้ยากแล้ว

ดังนั้นหากตั้งใจจะเก็บข้อมูลไว้ยาวๆ ตลอดไปแล้ว ก็ต้องมีการเคลื่อนย้ายข้อมูลไปยังสื่อใหม่ๆ ก่อนที่สื่อเดิมจะเสียหาย และ ก่อนที่จะหาเครื่องอ่านข้อมูลไม่ได้ด้วย

ปัญหาที่ท้าทายยิ่งขึ้นก็คือ การที่มีข้อมูลใหม่ๆ เพิ่มขึ้นเรื่อยๆ ทำให้มีข้อมูลที่ต้องย้ายทับถมทวีเป็นปริมาณเพิ่มขึ้นตามเวลา ลองนึกดูง่ายๆว่า ข้อมูลที่ต้องย้ายในปีที่ 10 คือ ข้อมูลตั้งแต่ปีที่ 1 ถึง 9 ข้อมูลที่ต้องย้ายในปีที่ 20 คือ ข้อมูลตั้งแต่ปีที่ 1 ถึง 19  คำถามคือแล้วเราจะสามารถย้ายข้อมูลได้ทันกับการเพิ่มขึ้นของข้อมูลหรือไม่

ผมลองคำนวณดูง่ายๆ โดยสมมุติให้อัตราการเกิดข้อมูลใหม่เพิ่มขึ้นแบบ exponential ความจำเป็นในการเคลื่อนย้ายข้อมูล (ในรูปของอัตรา) ก็จะเท่ากับผลรวมของ exponential นี้ แต่จะมีระยะเวลา lag เท่ากับอายุการใช้งานของสื่อบันทึกข้อมูล (ถ้าสื่อยังใช้งานได้ดี ก็ยังไม่จำเป็นต้องย้าย)​  ผมพบว่าถ้ามี lag time ที่เพียงพอ และ ถ้า exponent coefficient ของอัตราการเพิ่มสูงพอ อัตราการเพิ่มของข้อมูล จะสูงกว่าอัตราการย้ายข้อมูล (แม้เวลาจะผ่านไปหลายๆปี ก็ตาม) ซึ่งหมายความว่าถ้าเรามีเทคโนโลยีที่รองรับการเพิ่มข้อมูลได้ เราควรจะมีเทคโนโลยีที่สามารถย้ายข้อมูลได้ทันด้วยเช่นเดียวกัน

ไม่มีความคิดเห็น:

แสดงความคิดเห็น