Nội dung tài liệu XML
Khái niệm về nội dung tài liệu Xml
Nội dung của tài liệu XML bao gồm 2 phần
Nội dung chính
Hệ thống các thẻ đánh dấu ( có hay không có nội dung ) tương ứng với các thông tin cần biểu diễn
Nội dung phụ
Hệ thống các thẻ khác có ý nghĩa bổ sung, tăng cường một số thông tin về tài liệu XML. Các thẻ này có tác dụng giúp cho việc sử dụng, xử lý trên tài liệu XML tốt hơn trong một số trường hợp nhất địn
Các thẻ bên trong nội dung phụ bao gồm loại sau
– Thẻ khai báo tham số
– Thẻ chỉ thị xử lý
– Thẻ ghi chú
– Thẻ CDATA
– Thẻ khai báo cấu trúc
– Thẻ khai báo thực thể
Các thẻ khai báo tham số, thẻ chỉ thị xử lý,thẻ ghi chú và thẻ CDATA có ý nghĩa sử dụng đơn giản sẽ đuợc diễn giải chi tiết ngay trong phần sau
* Thẻ khai báo tham số
Thẻ khai báo tham số
Thẻ khai báo tham số cho phép mô tả thêm một số thông tin chung (tham số ) về tài liệu XML ngoài các thông tin đã biểu diễn trong nội dung chính.
Dạng khai báo chung như sau
Ten_1, Ten_2, … là các tên của các tham số và Gia_tri_1, Gia_tri_2, … là các giá trị tương ứng. Cho đến hiện nay có 3 tham số đuợc dùng là version, encoding, và standalone. Tham số version bắt buộc phải có nếu các tham số khác đuợc sử dụng
Tham số version : Khai báo về phiên bản của định chuẩn XML đuợc sử dụng
Tài liệu XML thuộc đỉnh chuẩn 1.0
Tham số encoding : Khai báo về cách mã hóa các ký tự trong tài liệu
Tài liệu XML sử dụng cách mã hóa Unicode ký hiệu utf-8
Tài liệu XML sử dụng cách mã hóa Unicode ký hiệu utf-16
Tham số standalone : Khai báo về liên kết của tài liệu XML và các tài liệu khác. Tham số này chỉ có 2 giá trị hợp lệ là “yes” , “no”. Giá trị định sẳn là “no”
Tài liệu XML có liên kết với các tài liệu khác
Tài liệu XML không có liên kết với các tài liệu khác
* Thẻ chỉ thị xử lý
Thẻ chỉ thị xử lý
Dạng khai báo chung như sau
Bo_xu_ly là ký hiệu của bộ xử lý sẽ tiến hành một số xử lý nào đó trên tài liệu XML . Du_lieu là thông tin được gởi đến Bo_xu_ly
* Thẻ ghi chú
Thẻ ghi chú
* Thẻ CDATA
Thẻ CDATA
Khái niệm về cấu trúc tài liệu XML
– Chỉ tương ứng cấu trúc của nội dung chính
– Cách thức tổ chức, sắp xếp của các thẻ (có hay không có nội dung) trong nội dung chính
Khái niệm về đặc tả cấu trúc tài liệu XML
– Mô tả ngắn gọn, chính xác cấu trúc tài liệu XML
– Mô tả ngắn gọn, chính xác cách thức tổ chức, sắp xếp của các thẻ
* Ngôn ngữ đặc tả cấu trúc
Có rất nhiều ngôn ngữ đặc tả đuợc đề xuất để mô tả cấu trúc tài liệu Xml như DTD, XML Schema, XMl- Data, Schematron , RELAX NG, v,v.. .Trong số đó có 2 ngôn ngữ thông dụng là DTD, XML Schema
Đặc điểm của DTD
– Ra đời rất sớm
– Cho phép mô tả văn bản có cấu trúc bất kỳ
– Đơn giản, dễ học và sử dụng
– Chỉ cho phép đặc tả một số “kiểu dữ liệu đơn giản” trong nội dung chính của tài liệu XML
Đặc điểm của XML Schema
– Đuợc đề xuất bởi W3C
– Chỉ áp dụng cho tài liệu XML
– Khó học và sử dụng so với DTD
– Cho phép đặc tả chi tiết về các “kiểu dữ liệu” đuợc sử dụng trong nội dung chính của tài liệu XML
* Sử dụng đặc tả cấu trúc
Ý nghĩa của đặc tả cấu trúc
Có 2 trường hợp chính cần thiết sử dụng các tài liệu đặc tả cấu trúc
– Trường hợp 1 : Sử dụng cho việc trao đổi thông tin người – người
– Trường hợp 1 : Sử dụng cho việc trao đổi thông tin người – hệ thống xử lý
Trường hợp 1 là trường hợp thông dụng nhất, với trường hợp này tài liệu đặc tả cấu trúc
– Có thể đuợc lưu trữ theo bất kỳ định dạng nào thích hợp cho việc sử dụng ( trình bày, xem báo cáo , v.v..)
Có thể sử dụng các tài liệu đặc tả cấu trúc ( DTD/ XML Schema trên ) trong
– Hồ sơ thiết kế phần mềm hay giáo trình này ( theo dạng tập tin của Microsoft Word)
– Tài liệu mô tả cách thức trao đổi thông tin giữa các chuyên viên tin cùng xây dựng các phần mềm bài tập phân số
-Đây là trường hợp dễ sử dụng nhất vì không yêu cầu thật chặt chẽ về cú pháp. Nếu trong tài liệu đặc tả cấu trúc có sai sót một ít về cú pháp thì người sử dụng cũng có thể hiểu hay cũng có thể phát hiện và trao đổi lại với người tạo lập
-Với trường hợp này, tùy vào từng trường hợp cụ thể với các một số qui ước riêng mang tính cục bộ trong một nhóm người nào đó, có thể mở rộng các ngôn ngữ đặc tả cấu trúc hiện có để bổ sung thêm các từ vựng, cú pháp và ngữ nghĩa riêng.
Trường hợp 2 chỉ đuợc sử dụng khi
– Có hệ thống xử lý (phần mềm, hàm , đối tượng thư viện ) “hiểu” và thực hiện các xử lý tương ứng nào đó với tài liệu đặc tả cấu trúc (xử lý thông dụng nhất là kiểm tra một tài liệu XML có theo đúng cấu trúc đuợc mô tả trong tài liệu đặc tả cấu trúc hay không.)
-Thật sự có nhu cấu cần đến các xử lý của hệ thống xử lý nói trên
– Có thể sử dụng các tài liệu đặc tả cấu trúc ( DTD/ XML Schema trên ) với bộ phân tích XmlTextReader trong chúng tôi để yêu cầu bộ phân tích này kiểm tra tính hợp lệ của tài liệu XML. Tuy nhiên, một cách tổng quát xử lý kiểm tra này không thật sự cần thiết !!!
-Trường hợp này yêu cầu tài liệu đặc tả cấu trúc phải tuân thủ hoàn toàn theo ngôn ngữ đặc tả cấu trúc tương ứng, mọi sai sót về cú pháp sẽ không đuợc bộ phân tích cú pháp chấp nhận.
-Cần cân nhắc khi sử dụng tài liệu đặc tả cấu trúc trong trường hợp này vì một trong các đặc điểm quan trọng trong tiếp cận của XML là “Cho phép đặc tả nội dung mà không nhất thiết đặc tả cấu trúc “