Xml Là Gì Cấu Trúc Xml Cách Sử Dụng Xml / Top 8 # Xem Nhiều Nhất & Mới Nhất 5/2023 # Top View | Nhatngukohi.edu.vn

File Xml Là Gì? Đọc File Xml Bằng Cách Nào?

Khi sử dụng máy tính chắc hẳn bạn đã từng gặp phải file XML và để đọc được file này chúng ta phải có một phần mềm chuyên biệt cho nó. Bài viết dưới này chúng ta sẽ cùng tìm hiểu file XML là gì? Và phần mềm nào có thể đọc file này.

I. XML là gì? Tác dụng của file XML

XML (Extensible Markup Language) là ngôn ngữ đánh dấu mở rộng. Đây là một dạng ngôn ngữ đánh dấu, có chức năng truyền dữ liệu và mô tả nhiều loại dữ liệu khác nhau.

II. Đặc điểm của XML

XML được dùng cho dữ liệu có cấu trúc.

Về trực quan, XML khá giống với HTML.

Tuy là văn bản, nhưng XML không phải dùng để đọc.

XML thường rất dài.

XML được coi là cầu nối đưa HTML tới XHTML và là nền tảng cho RDF và Web mã hóa.

XML là một module.

XML miễn phí bản quyền, platform độc lập và được hỗ trợ rất tốt.

1. Ưu điểm của XML

Ưu điểm lớn nhất của XML chính là sự độc lập. Điều này cũng rất dễ hiểu, vì XML được sử dụng để mô tả dữ liệu dưới dạng text, nên hầu hết các phần mềm hay các chương trình bình thường đều có thể đọc được chúng.

XML có thể đọc và phân tích nguồn dữ liệu khá dễ dàng nên nó được sử dụng với mục đích chính là trao đổi dữ liệu giữa các chương trình, các hệ thống khác nhau. XML được sử dụng cho Remote Procedure Calls nhằm phục vụ cho các dịch vụ của website.

2. Nhược điểm của XML

Tỷ lệ sai sót khi sử dụng XML để truyền dữ liệu khoảng từ 5-7%. Con số này tuy không quá cao, nhưng trên thực tế, người ta vẫn cần cân nhắc trước khi sử dụng nó để trao đổi thông tin.

III. Đọc file XML bằng phần mềm nào?

Không giống như PDF, phần mềm đọc XML duy nhất hiện nay được đánh giá cao là iTaxViewer. Các bạn có thể download miễn phí phần mềm iTaxViewer cho máy tính.

Ngoài ra, còn có một số công cụ khác được sử dụng với XML như:

-Chỉnh sửa và biên tập file XML: XML Notepad, Altova XMLSpy Enterprise Edition …

-Chuyển đổi định dạng XML: AZ XML to PDF Converter, Total CSV Converter, Word Cleaner, PDF to XML …

Kết luận

Bài 01: Xml Là Gì? Cú Pháp Căn Bản Của Xml

Ngoài cách lưu trữ dữ liệu trong các hệ quản trị CSDL ra thì bạn có thể lưu trữ dữ liệu trong file TXT, file JSON hay file XML đều được. Tuy nhiên với những hệ thống lớn thì bắt buộc ta phải lưu trữ trong hệ quản trị CSDL bởi vì nó cũng cấp những tính năng giúp quản lý dữ liệu tốt hơn. Còn đối với XML hay JSON thì ứng dụng lớn nhất của nó trong lập trình web đó là xây dựng các Service và API, nghĩa là các API đó sẽ trả kết quả về dạng JSON hoặc XML các hệ thống khác có thể hiểu được. Ví dụ để tạo một ứng dụng đặt phòng trên mobile thì bạn phải xây dựng một Service và nhiệm vụ của service đó là trả kết quả danh sách phòng về cho App Mobile, mà với ngôn ngữ lập trình Mobile khác hoàn toàn với PHP hay C# nên ta phải trao đổi dữ liệu thông qua XML hoặc JSON.

Hiện nay người ta hay sử dụng JSON hơn là XML nhưng mình đã có một loạt bài viết về JSON rồi nên trong loạt bài viết này ta sẽ tìm hiểu về XML. Bài đầu tiên này ta sẽ tìm hiểu khái niệm về XML là gì và cách tạo một file XML đơn giản.

XML là viết tắt của từ eXtensible Markup Language, hay còn gọi là ngôn ngữ đánh dấu mở rộng do W3C đề nghị với mục đích tạo ra các ngôn ngữ đánh dấu khác. Đây là một tập hợp con đơn giản có thể mô tả nhiều loại dữ liệu khác nhau nên rất hữu ích trong việc chia sẻ dữ liệu giữa các hệ thống. Ví dụ khi bạn xây dựng một ứng dụng bằng C# và một ứng dụng bằng PHP thì hai ngôn ngữ này không thể hiểu nhau, vì vậy ta sẽ sử dụng XML để trao đổi dữ liệu.

Tất cả những đặc tả dữ liệu XML đều phải tuân theo quy luật và cú pháp của nó nên hầu như các file XML đều rất nghiêm khắc trong việc biên dịch. Tuy nhiên công nghệ này cần phải được xem xét bởi vì trong quá trình thao tác và truyền dữ liệu nó có tỉ lệ sai sót lên tới 5% – 7%. Con số này không cao nhưng cũng rất đáng để cân nhức khi sử dụng.

Điển hình nhất là ngôn ngữ đánh dấu siêu văn bản HTML sử dụng cú pháp của XML để tạo nên và nó có các bộ phần tử và thuộc tính không mềm dẻo nên chỉ có tác dụng trong việc trình bày dữ liệu trên trình duyệt Browser.

2. Cú pháp của tài liệu XML

Nếu bạn đã học qua HTML rồi thì rất dễ dàng hiểu cú pháp của XML bởi vì HTML được xây dựng dựa trên cú pháp của XML.

File XML sẽ có phần mở rộng là .xml. Tuy nhiên bạn hoàn toàn có thể sử dụng ngôn ngữ lập trình để thay đổi phần mở rộng cho nó ( sẽ tìm hiểu sau).

Cú pháp của thẻ XML:

XML được xây dựng dựa vào cấu trúc NODE lồng nhau, mỗi node sẽ có một thẻ mở và một thẻ đóng như sau:

Trong đó:

content là nội dung của thẻ này

Ví dụ mình lưu trữ domain của mình thì cấu trúc như sau:

Bạn hoàn toàn có thể bổ sung các thuộc tính vào các thẻ XML bằng cách sử dụng cú pháp sau:

Ví dụ bạn lưu trữ thông tin domain và chủ sở hữu của nó thì có thể lưu như sau:

Khai báo Header (Chỉ thị xử lý):

Trên đầu mỗi file XML bạn phải khai báo một thẻ để thông báo version XML đang sử dụng ( thường là version 1.0), và còn có thể chứa các thông tin về mã hóa ký tự hoặc các phụ thuộc bên ngoài khác ( sẽ tìm hiểu sau). Giá trị của encoding ( kiểu mã hóa ký tự) thuộc một trong các định dạng sau: UTF-8, UTF-16, ISO-10646-UCS-2, ISO-10646-UCS-4, ISO-8859-1 to ISO-8859-9, ISO-2022-JP, Shift_JIS, EUC-JP.

Cú pháp của thẻ chỉ thị xử lý như sau:

Như vậy với các ví dụ trên thì cấu trúc đúng sẽ phải là:

Và:

Root node:

Mỗi tài liệu XML nên có một thẻ ngoài cùng và ta gọi thẻ này là root node. Thẻ này sẽ khai báo tên chính của tài liệu XML.

Ví dụ mình cần lưu trữ danh sách domain thì có thể viết như sau:

Không có một quy tắc đặt tên nào cả mà quy tắt do lập trình viên đặt ra, tuy nhiên lời khuyên là bạn nên đặt tên sao cho ngữ nghĩa phù hợp với nội dung của file.

Phần này chúng ta sẽ tìm hiểu rõ hơn ở bài tiếp theo.

3. Lời kết

Định Dạng File Đuôi Xml Là Gì ?

Một tệp có phần mở rộng tệp .xml là tệp Ngôn ngữ đánh dấu mở rộng (XML). Đây thực sự chỉ là các tệp văn bản đơn giản sử dụng các thẻ tùy chỉnh để mô tả cấu trúc và các tính năng khác của tài liệu.

XML là ngôn ngữ đánh dấu được tạo bởi World Wide Web Consortium (W3C) để xác định cú pháp mã hóa tài liệu mà cả người và máy đều có thể đọc được. Nó thực hiện điều này thông qua việc sử dụng các thẻ xác định cấu trúc của tài liệu, cũng như cách tài liệu nên được lưu trữ và vận chuyển.

Nó có thể dễ dàng nhất để so sánh nó với một ngôn ngữ đánh dấu khác mà bạn có thể quen thuộc với ngôn ngữ đánh dấu siêu văn bản (HTML) được sử dụng để mã hóa các trang web. HTML sử dụng một bộ ký hiệu đánh dấu được xác định trước (mã ngắn) mô tả định dạng của nội dung trên trang web. Ví dụ: mã HTML đơn giản sau đây sử dụng các thẻ để làm cho một số từ in đậm và một số chữ in nghiêng:

Tuy nhiên, điều làm nên sự khác biệt của XML là nó có khả năng mở rộng. XML không có ngôn ngữ đánh dấu được xác định trước, giống như HTML. Thay vào đó, XML cho phép người dùng tạo các biểu tượng đánh dấu của riêng họ để mô tả nội dung, tạo một bộ biểu tượng không giới hạn và tự xác định.

Về cơ bản, HTML là ngôn ngữ tập trung vào việc trình bày nội dung, trong khi XML là ngôn ngữ mô tả dữ liệu chuyên dụng được sử dụng để lưu trữ dữ liệu.

RSS và ATOM đều mô tả cách các ứng dụng đọc xử lý các nguồn cấp web.

Microsoft .NET sử dụng XML cho các tệp cấu hình của nó.

Microsoft Office 2007 trở lên sử dụng XML làm cơ sở cho cấu trúc tài liệu.Ví dụ, đó là những gì mà ‘X’ có nghĩa là định dạng tài liệu Word .DOCX và nó cũng được sử dụng trong Excel (tệp XLSX) và PowerPoint (tệp PPTX).

Vì vậy, nếu bạn có một tệp XML, thì điều đó không nhất thiết phải cho bạn biết ứng dụng mà nó dùng để sử dụng. Và thông thường, bạn đã thắng được cần phải lo lắng về điều đó, trừ khi bạn là người thực sự thiết kế các tệp XML.

Cách mở file .XML

Có một số cách bạn có thể mở tệp XML trực tiếp. Bạn có thể mở và chỉnh sửa chúng bằng bất kỳ trình soạn thảo văn bản nào, xem chúng bằng bất kỳ trình duyệt web nào hoặc sử dụng trang web cho phép bạn xem, chỉnh sửa và thậm chí chuyển đổi chúng sang các định dạng khác.

Sử dụng Trình soạn thảo văn bản nếu bạn thường xuyên làm việc với các tệp XML

Vì các tệp XML thực sự chỉ là các tệp văn bản, bạn có thể mở chúng trong bất kỳ trình soạn thảo văn bản nào. Vấn đề là, rất nhiều trình soạn thảo văn bản, giống như Notepad, chỉ cần thiết kế để hiển thị các tệp XML với cấu trúc phù hợp của chúng. Có thể ổn khi mở một tệp XML đang mở và xem nhanh để giúp tìm ra nó là gì. Nhưng, có nhiều công cụ tốt hơn để làm việc với họ.

Bấm chuột phải vào tệp XML mà bạn muốn mở, trỏ đến Tập “Open With” trên menu, rồi bấm vào tùy chọn Notepad.

Lưu ý: Chúng tôi sử dụng các ví dụ Windows ở đây, nhưng điều tương tự cũng đúng với các hệ điều hành khác. Hãy tìm một trình soạn thảo văn bản của bên thứ ba tốt được thiết kế để hỗ trợ các tệp XML.

Vì vậy, mặc dù Notepad có thể hữu ích để kiểm tra nhanh một tệp XML, nhưng bạn có thể sử dụng công cụ nâng cao hơn như Notepad ++, làm nổi bật cú pháp và định dạng tệp theo cách mà nó dự định.

Đây là cùng một tệp XML được mở trong Notepad ++:

Sử dụng trình duyệt web để xem dữ liệu có cấu trúc

Nếu không thực sự cần chỉnh sửa các tệp XML, nhưng chỉ cần thỉnh thoảng xem chúng, trình duyệt mà bạn sử dụng để đọc bài viết này rất phù hợp với công việc. Và trên thực tế, trình duyệt web mặc định của bạn có thể được thiết lập làm trình xem mặc định cho các tệp XML. Vì vậy, nhấp đúp vào tệp XML sẽ mở tệp đó trong trình duyệt của bạn.

Nếu không, bạn có thể nhấp chuột phải vào tệp để tìm các tùy chọn để mở tệp bằng bất kỳ ứng dụng nào bạn muốn. Chỉ cần chọn trình duyệt web của bạn từ danh sách các chương trình. Chúng tôi đã sử dụng Chrome trong ví dụ này.

Khi tệp mở ra, bạn sẽ thấy dữ liệu có cấu trúc độc đáo. Nó không đẹp như giao diện được mã hóa màu mà bạn có với một cái gì đó như Notepad ++, nhưng nó lại có tầm nhìn xa hơn so với những gì bạn có với Notepad.

Sử dụng Trình chỉnh sửa trực tuyến để xem, chỉnh sửa hoặc chuyển đổi tệp XML

Nếu muốn chỉnh sửa tệp XML không thường xuyên và không muốn tải xuống trình soạn thảo văn bản mới hoặc nếu bạn cần chuyển đổi tệp XML sang định dạng khác, có một số trình soạn thảo XML trực tuyến phù hợp miễn phí. chúng tôi , chúng tôi và chúng tôi đều cho phép bạn xem và chỉnh sửa các tệp XML. Sau khi bạn thực hiện chỉnh sửa, bạn có thể tải xuống tệp XML đã thay đổi hoặc thậm chí chuyển đổi nó sang định dạng khác.

Ví dụ ở đây, chúng tôi sẽ sử dụng chúng tôi Trang này được chia thành ba phần. Bên trái là tệp XML mà bạn đang làm việc. Ở giữa, bạn sẽ tìm thấy một số tùy chọn. Ở bên phải, bạn sẽ thấy kết quả của một số tùy chọn bạn có thể chọn. Ví dụ, trong hình ảnh bên dưới, tệp XML đầy đủ của chúng tôi nằm ở bên trái và chế độ xem dạng cây đang hiển thị trong ngăn kết quả vì chúng tôi đã nhấp vào nút Chế độ xem cây Tree ở giữa.

Ở đây, một cái nhìn tốt hơn về các tùy chọn đó. Sử dụng nút “Browse” của Wikipedia để tải lên tệp XML từ máy tính của bạn hoặc nút “Load URL” để kéo XML từ một nguồn trực tuyến.

“Tree View” hiển thị dữ liệu của bạn trong cấu trúc cây được định dạng độc đáo trong ngăn kết quả, với tất cả các thẻ của bạn ở bên trái màu cam và các thuộc tính ở bên phải của thẻ.

“Beautify” hiển thị dữ liệu của bạn trong các dòng gọn gàng, dễ đọc trong khung kết quả.

Nút “Minify” hiển thị dữ liệu của bạn bằng cách sử dụng ít khoảng trắng nhất có thể. Nó sẽ cố gắng đặt từng phần dữ liệu trên một dòng. Điều này có ích khi cố gắng làm cho tập tin nhỏ hơn. Nó sẽ tiết kiệm một số không gian, nhưng với chi phí để có thể đọc nó một cách hiệu quả.

Và cuối cùng, bạn có thể sử dụng nút “XML to JSON” để chuyển đổi định dạng XML sang JSON, nút “Export to CSV” để lưu dữ liệu của bạn dưới dạng tệp giá trị được phân tách bằng dấu phẩy hoặc nút “Dowload” để tải xuống bất kỳ thay đổi nào bạn đã tạo như một tệp XML mới.

Vậy là hôm nay chúng ta đã tìm hiểu được tệp .xml nghĩa là gì và môi trường để nó có thể sử dụng tối ưu nhất giúp chúng ta có thể dễ dàng làm việc nhất có thể.

Đặc Tả Nội Dung Và Cấu Trúc Tài Liệu Xml

Nội dung tài liệu XML

Khái niệm về nội dung tài liệu Xml

Nội dung của tài liệu XML bao gồm 2 phần

Nội dung chính

Hệ thống các thẻ đánh dấu ( có hay không có nội dung ) tương ứng với các thông tin cần biểu diễn

Nội dung phụ

Hệ thống các thẻ khác có ý nghĩa bổ sung, tăng cường một số thông tin về tài liệu XML. Các thẻ này có tác dụng giúp cho việc sử dụng, xử lý trên tài liệu XML tốt hơn trong một số trường hợp nhất địn

Các thẻ bên trong nội dung phụ bao gồm loại sau

– Thẻ khai báo tham số

– Thẻ chỉ thị xử lý

– Thẻ ghi chú

– Thẻ CDATA

– Thẻ khai báo cấu trúc

– Thẻ khai báo thực thể

Các thẻ khai báo tham số, thẻ chỉ thị xử lý,thẻ ghi chú và thẻ CDATA có ý nghĩa sử dụng đơn giản sẽ đuợc diễn giải chi tiết ngay trong phần sau

* Thẻ khai báo tham số

Thẻ khai báo tham số

Thẻ khai báo tham số cho phép mô tả thêm một số thông tin chung (tham số ) về tài liệu XML ngoài các thông tin đã biểu diễn trong nội dung chính.

Dạng khai báo chung như sau

Ten_1, Ten_2, … là các tên của các tham số và Gia_tri_1, Gia_tri_2, … là các giá trị tương ứng. Cho đến hiện nay có 3 tham số đuợc dùng là version, encoding, và standalone. Tham số version bắt buộc phải có nếu các tham số khác đuợc sử dụng

Tham số version : Khai báo về phiên bản của định chuẩn XML đuợc sử dụng

Tài liệu XML thuộc đỉnh chuẩn 1.0

Tham số encoding : Khai báo về cách mã hóa các ký tự trong tài liệu

Tài liệu XML sử dụng cách mã hóa Unicode ký hiệu utf-8

Tài liệu XML sử dụng cách mã hóa Unicode ký hiệu utf-16

Tham số standalone : Khai báo về liên kết của tài liệu XML và các tài liệu khác. Tham số này chỉ có 2 giá trị hợp lệ là “yes” , “no”. Giá trị định sẳn là “no”

Tài liệu XML có liên kết với các tài liệu khác

Tài liệu XML không có liên kết với các tài liệu khác

* Thẻ chỉ thị xử lý

Thẻ chỉ thị xử lý

Dạng khai báo chung như sau

Bo_xu_ly là ký hiệu của bộ xử lý sẽ tiến hành một số xử lý nào đó trên tài liệu XML . Du_lieu là thông tin được gởi đến Bo_xu_ly

* Thẻ ghi chú

Thẻ ghi chú

* Thẻ CDATA

Thẻ CDATA

Khái niệm về cấu trúc tài liệu XML

– Chỉ tương ứng cấu trúc của nội dung chính

– Cách thức tổ chức, sắp xếp của các thẻ (có hay không có nội dung) trong nội dung chính

Khái niệm về đặc tả cấu trúc tài liệu XML

– Mô tả ngắn gọn, chính xác cấu trúc tài liệu XML

– Mô tả ngắn gọn, chính xác cách thức tổ chức, sắp xếp của các thẻ

* Ngôn ngữ đặc tả cấu trúc

Có rất nhiều ngôn ngữ đặc tả đuợc đề xuất để mô tả cấu trúc tài liệu Xml như DTD, XML Schema, XMl- Data, Schematron , RELAX NG, v,v.. .Trong số đó có 2 ngôn ngữ thông dụng là DTD, XML Schema

Đặc điểm của DTD

– Ra đời rất sớm

– Cho phép mô tả văn bản có cấu trúc bất kỳ

– Đơn giản, dễ học và sử dụng

– Chỉ cho phép đặc tả một số “kiểu dữ liệu đơn giản” trong nội dung chính của tài liệu XML

Đặc điểm của XML Schema

– Đuợc đề xuất bởi W3C

– Chỉ áp dụng cho tài liệu XML

– Khó học và sử dụng so với DTD

– Cho phép đặc tả chi tiết về các “kiểu dữ liệu” đuợc sử dụng trong nội dung chính của tài liệu XML

* Sử dụng đặc tả cấu trúc

Ý nghĩa của đặc tả cấu trúc

Có 2 trường hợp chính cần thiết sử dụng các tài liệu đặc tả cấu trúc

– Trường hợp 1 : Sử dụng cho việc trao đổi thông tin người – người

– Trường hợp 1 : Sử dụng cho việc trao đổi thông tin người – hệ thống xử lý

Trường hợp 1 là trường hợp thông dụng nhất, với trường hợp này tài liệu đặc tả cấu trúc

– Có thể đuợc lưu trữ theo bất kỳ định dạng nào thích hợp cho việc sử dụng ( trình bày, xem báo cáo , v.v..)

Có thể sử dụng các tài liệu đặc tả cấu trúc ( DTD/ XML Schema trên ) trong

– Hồ sơ thiết kế phần mềm hay giáo trình này ( theo dạng tập tin của Microsoft Word)

– Tài liệu mô tả cách thức trao đổi thông tin giữa các chuyên viên tin cùng xây dựng các phần mềm bài tập phân số

-Đây là trường hợp dễ sử dụng nhất vì không yêu cầu thật chặt chẽ về cú pháp. Nếu trong tài liệu đặc tả cấu trúc có sai sót một ít về cú pháp thì người sử dụng cũng có thể hiểu hay cũng có thể phát hiện và trao đổi lại với người tạo lập

-Với trường hợp này, tùy vào từng trường hợp cụ thể với các một số qui ước riêng mang tính cục bộ trong một nhóm người nào đó, có thể mở rộng các ngôn ngữ đặc tả cấu trúc hiện có để bổ sung thêm các từ vựng, cú pháp và ngữ nghĩa riêng.

Trường hợp 2 chỉ đuợc sử dụng khi

– Có hệ thống xử lý (phần mềm, hàm , đối tượng thư viện ) “hiểu” và thực hiện các xử lý tương ứng nào đó với tài liệu đặc tả cấu trúc (xử lý thông dụng nhất là kiểm tra một tài liệu XML có theo đúng cấu trúc đuợc mô tả trong tài liệu đặc tả cấu trúc hay không.)

-Thật sự có nhu cấu cần đến các xử lý của hệ thống xử lý nói trên

– Có thể sử dụng các tài liệu đặc tả cấu trúc ( DTD/ XML Schema trên ) với bộ phân tích XmlTextReader trong chúng tôi để yêu cầu bộ phân tích này kiểm tra tính hợp lệ của tài liệu XML. Tuy nhiên, một cách tổng quát xử lý kiểm tra này không thật sự cần thiết !!!

-Trường hợp này yêu cầu tài liệu đặc tả cấu trúc phải tuân thủ hoàn toàn theo ngôn ngữ đặc tả cấu trúc tương ứng, mọi sai sót về cú pháp sẽ không đuợc bộ phân tích cú pháp chấp nhận.

-Cần cân nhắc khi sử dụng tài liệu đặc tả cấu trúc trong trường hợp này vì một trong các đặc điểm quan trọng trong tiếp cận của XML là “Cho phép đặc tả nội dung mà không nhất thiết đặc tả cấu trúc “