Huế là vùng đất văn hiến với bề dày lịch sử - văn hóa lâu đời. Hơn 700 năm hình thành và phát triển, Huế - cố đô của nước Việt - là trung tâm văn hóa, chính trị, kinh tế của Việt Nam từ thế kỷ XVII cho đến nay. Nơi đây ghi dấu nhiều chiến tích hào hùng của triều đại Tây Sơn, gắn liền với sự hình thành và phát triển của chín đời chúa, mười ba đời vua Nguyễn, và song hành cùng các cuộc chiến đấu chống thực dân Pháp và và đế quốc Mỹ. Huế đã chứng kiến sự đổi thay và chuyển mình vươn lên của người dân thành phố qua các thời kỳ. Nơi đây hội tụ và tích lũy các giá trị vật chất và tinh thần tạo nên một không gian văn hóa phong phú và đặc sắc của Việt Nam. Tuy nhiên, những nét văn hóa của vùng đất cố đô xưa đang phai nhạt dần và có nguy cơ mai một qua thời gian. Khá nhiều tài liệu và di vật về Huế bị thất thoát và tiêu hủy trong thời kỳ chiến tranh, một số khác bị hư hỏng nặng do thiên tai, bão lũ và do khí hậu nóng ẩm thất thường của miền Trung. May mắn thay, một số tài liệu và di vật vẫn còn được lưu giữ tản mạn trong các gia đình ở Huế hoặc ở các đơn vị lưu trữ khắp trong và ngoài nước.
Nhận thấy việc sưu tập và bảo quản tài liệu văn hóa Huế đã trở thành một nhiệm vụ khẩn trương của các đơn vị văn hóa ở Huế nói riêng và người dân Huế nói chung, Trung tâm Học liệu Đại học Huế đã tự nguyện đứng ra làm đầu mối để sưu tầm, số hóa và bảo quản số tài liệu về Huế nhằm có thể lưu giữ vốn tài sản tri thức vô giá, đồng thời, góp phần cung cấp thông tin cho cộng đồng Đại học Huế cũng như các nhà nghiên cứu Huế.
Về bộ sưu tập số
Việc số hóa tài liệu tại Trung tâm Học liệu Huế nhằm mục đích bảo quản và quy tụ các nguồn tài liệu quý về một mối nhằm giúp bạn đọc và các nhà nghiên cứu tiếp cận được thông tin về Huế một cách đầy đủ, thuận tiện nhất. Bộ sưu tập số về văn hóa – lịch sử Huế sẽ góp phần phục vụ có hiệu quả hơn công tác giảng dạy, học tập và nghiên cứu khoa học của giảng viên, sinh viên Đại học Huế nói riêng và bạn đọc cả nước nói chung.
Dự án số hóa chủ yếu do cán bộ phòng Tài nguyên Thông tin thực hiện với sự trợ giúp về mặt kỹ thuật của cán bộ Công nghệ Thông tin. Từ những ngày đầu tiếp cận với công việc số hóa, cán bộ của Trung tâm đã tự tìm hiểu, nghiên cứu và tiếp cận với các quy trình số hóa thông qua các nguồn tài liệu sẵn có trên mạng, đồng thời tích cực học hỏi kinh nghiệm từ những cá nhân, đơn vị đi trước. Ngoài ra, với phương châm vừa học vừa làm, chúng tôi đã thu thập được nhiều kinh nghiệm quý báu từ công việc thực tiễn và dần dần có những sửa đổi phù hợp với điều kiện và quy mô của dự án.
Phát triển bộ sưu tập
Mục tiêu của dự án số hóa tại Trung tâm Học liệu Huế là sưu tập và số hóa tất cả các tài liệu quý liên quan đến Huế, mà phần lớn những tài liệu này hiện trong tình trạng xuống cấp và đang được lưu giữ tản mác ở các gia đình và cơ quan văn hóa trên toàn quốc. Với đặc điểm trên của tài liệu, việc lựa chọn tài liệu cũng đóng một vai trò quan trọng mang tính quyết định đến kết quả và chất lượng của bộ sưu tập số. Phần lớn tài liệu được lựa chọn dựa trên các tiêu chuẩn sau:
- Nội dung: Liên quan đến văn hóa, lịch sử Huế. Đây là tiêu chuẩn hàng đầu khi lựa chọn tài liệu.
- Năm xuất bản: Trước 1975.
- Loại hình tài liệu: Bản thảo, sắc phong, chiếu chỉ, sách, bản đồ, tạp chí, các di vật, cổ vật v.v liên quan đến Huế.
- Tình trạng tài liệu: Các tài liệu có nguy cơ bị hư hại, xuống cấp và dễ bị hỏng khi có tác động của thời tiết như thiên tai, độ ẩm v.v.
Trang thiết bị và phần mềm
Về trang thiết bị, phần lớn các thiết bị sử dụng đều có giá thành thấp nhưng phục vụ tối đa việc số hóa, trừ máy quét ba chiều dùng để scan vật thể và sách quý (do yêu cầu hạn chế cọ xát với bề mặt tiếp xúc). Các trang thiết bị bao gồm:
+ 1 máy scan 3 chiều
+ 3 máy scan thông thường
+ 1 máy ảnh
+ 3 máy tính có cấu hình cao
+ 1 đĩa ghi DVD
+ 4 ổ SATA lưu dữ liệu (mỗi ổ 500 GB)
Số hóa là một công việc phức tạp yêu cầu sự cẩn thận, tỉ mỉ qua nhiều giai đoạn. Công việc số hóa ở quy mô lớn thường phải sử dụng các phần mềm chuyên nghiệp, có tính ứng dụng và bảo mật cao. Tuy nhiên, đa phần các phần mềm này có giá thành khá đắt so với khả năng tài chính của thư viện. Do vậy, Trung tâm Học liệu Huế chỉ ưu tiên sử dụng các phần mềm miễn phí và phù hợp với quy trình số hóa tài liệu ở quy mô nhỏ như dự án số hóa nguồn tài liệu quý liên quan đến Huế tại đây. Các phần mềm được sử dụng bao gồm:
+ Phần mềm xử lý ảnh: Adobe Photoshop
+ Phần mềm chuyển file (TIFF sang JPG): ALsee hay 36 Image Converter
+ Phần mềm đóng file pdf: Acrobat 9.0 (đóng các file ảnh thành một file pdf)
+ Phần mềm đánh đĩa CD/DVD: Nero 7.0
+ Phần mềm xây dựng bộ sưu tập và tạo siêu dữ liệu: Greenstone
Các vấn đề về kỹ thuật
Scan tài liệu không phải là công việc yêu cầu kỹ thuật cao nhưng lại đòi hỏi nhiều thời gian và công sức. Để đảm bảo tính nhất quán và thuận tiện cho việc xử lý tự động một số lượng lớn các file hình ảnh sau khi scan, chúng tôi đã đề ra các nguyên tắc xử lý. Tất cả các nguyên tắc này, từ cơ bản như về độ phân giải, màu chuẩn, định dạng file, cách đặt tên, cách lưu file, đến những nguyên tắc đòi hỏi thao tác tỉ mỉ như hiệu chỉnh kích thước, căn chỉnh các lề trái, phải hay cắt giảm dung lượng v.v đều phải được tuân thủ chặt chẽ trong suốt quá trình thực hiện.
+ Về độ phân giải:
- 300 dpi cho sách, tạp chí cũ và bản thảo kích cỡ nhỏ.
- 500 dpi cho bản đồ, sắc phong, chiếu chỉ v.v có kích cỡ lớn.
+ Về dạng file lưu:
- Đối với sách, tạp chí cũ và bản thảo: Dạng file TIFF (áp dụng cho 80% bộ sưu tập số áp) hoặc JPEG (áp dụng cho tài liệu photo và tài liệu có chất lượng tốt nhằm giảm dung lượng lưu trữ) được sử dụng để lưu trữ và dạng file .pdf cho mục đích truy cập.
- Đối với ảnh và vật thể: Dạng file JPEG được dùng cho mục đích lưu trữ và truy cập.
- Đối với bản đồ, sắc phong, chiếu chỉ và các tài liệu có khổ lớn khác: dạng file JPEG được sử dụng cho mục đích lưu trữ và truy cập.
+ Sao lưu: Bộ sưu tập số sẽ được lưu trữ dưới nhiều hình thức khác nhau và ở nhiều địa điểm khác nhau. Việc kiểm tra và diệt virút được thực hiện trước khi đánh đĩa, sao lưu và đưa lên trang Web:
+ Hình thức lưu trữ: Lưu trữ ở ổ cứng SATA di động, ổ đĩa CD/DVD, lưu ở máy chủ (server) và trên cơ sở dữ liệu.
+ Địa điểm lưu trữ: Ở thư viện, tại cơ quan hoặc nhà riêng của các cá nhân lưu giữ bản gốc tài liệu.
+ Cách đặt tên file:
Để đảm bảo tính nhất quán và thuận tiện cho việc xử lý tự động các file sau khi scan, một số quy định chung về cách đặt tên file đã được đề ra như một tiêu chuẩn của quy trình số hóa:
- Sử dụng một trong 3 định dạng file: .tif, .jpg, .gif.
- Sử dụng chữ thường khi đặt tên.
- Sử dụng chữ số tượng trưng cho số tập của tài liệu.
- Độ dài tên file phải nhất quán.
- Đối với sách và bản thảo, tên file gồm 10 ký tự: 4 chữ cái đầu tiên (tên viết tắt của 4 từ đầu của nhan đề) + 2 ký tự tiếp theo (số tập) + 4 ký tự tiếp theo (số trang).
Ví dụ 1: Scan trang 1, quyển “An Nam Chí Lược”, tên file được đặt như sau: ancl000001.tif.
Ví dụ 2: Scan trang 1, quyển “Quốc Triều Chính Biên”, tập 1, tên file được đặt như sau: qtcb010001.tif.
- Đối với hình ảnh và các dạng tài liệu đơn giản, tên file gồm 6 ký tự: 2 ký tự đầu (tên viết tắt 2 từ đầu của tên bộ sưu tập) + 4 ký tự tiếp theo (số thứ tự của tấm ảnh trong bộ sưu tập).
Ví dụ: Ảnh thứ nhất trong bộ sưu tập ảnh về triều Nguyễn, tên file được đặt như sau: tn0001.jpg.
(Tác giả: Hồ Thị Ngọc Hân và Tôn Nữ Cát Tiên)