Tiga peraturan asas bahasa penanda xml. Asas XML - Penanda dan struktur dokumen XML. Membina Dokumen XML

bahasa penanda) ialah satu set arahan khas, dipanggil tag, direka bentuk untuk membentuk struktur dalam dokumen dan mentakrifkan hubungan antara pelbagai elemen struktur ini. Dalam erti kata lain, markup menunjukkan bahagian dokumen mana yang merupakan tajuk, yang merupakan sari kata, nama pengarang yang perlu dipertimbangkan, dll. Penandaan dibahagikan kepada penanda gaya, struktur dan semantik.

Penanda bergaya

Penanda bergaya bertanggungjawab untuk penampilan dokumen. Sebagai contoh, dalam HTML jenis markup ini termasuk tag seperti (condong), (bold), (garis bawah), (teks yang dicoret), dsb.

Penandaan struktur

Penanda struktur mentakrifkan struktur dokumen. Dalam HTML, sebagai contoh, tag (perenggan) bertanggungjawab untuk jenis markup ini. (tajuk),

(bahagian), dsb.

Penanda semantik

Penanda semantik memberitahu kandungan data. Contoh penanda jenis ini ialah tag (nama dokumen), (kod, digunakan untuk penyenaraian kod), (pembolehubah),

(alamat penulis).

Konsep asas mana-mana bahasa penanda ialah tag, elemen dan atribut.

Tag dan elemen.

Makna tag dan elemen sering keliru.

Teg, atau deskriptor kawalan sebagaimana ia juga dipanggil, berfungsi sebagai arahan untuk atur cara yang memaparkan kandungan dokumen pada bahagian klien tentang perkara yang perlu dilakukan dengan kandungan teg. Tanda kurung sudut digunakan untuk membezakan teg berbanding dengan kandungan utama dokumen: teg bermula dengan tanda kurang daripada (<) и завершается знаком "больше" (>), di dalamnya nama arahan dan parameternya diletakkan. Sebagai contoh, dalam HTML teg menunjukkan bahawa teks yang berikut hendaklah dalam huruf condong.

Elemen ialah tag bersama dengan kandungannya. Pembinaan berikut ialah contoh elemen:

Teks ini dalam huruf condong .

Elemen ini terdiri daripada tag pembuka (dalam contoh kami ini ialah tag ), kandungan tag (dalam contoh ini ialah teks "Ini adalah teks dalam huruf condong") dan tag penutup(), walaupun kadangkala dalam HTML, teg penutup boleh diabaikan.

Atribut

Untuk menetapkan sebarang parameter yang menjelaskan ciri elemen ini apabila mentakrifkan elemen, atribut digunakan.

Atribut terdiri daripada pasangan nama = nilai yang boleh ditentukan semasa mentakrifkan elemen dalam teg permulaan. Anda boleh meninggalkan ruang di sebelah kiri dan kanan simbol sama. Nilai atribut ditentukan sebagai rentetan yang disertakan dalam petikan tunggal atau berganda.

Mana-mana teg boleh mempunyai atribut jika atribut itu ditakrifkan.

Apabila atribut digunakan, elemen mengambil bentuk berikut:

<имя_тега атрибут = "значение"> kandungan tag

Teks dijajarkan ke tengah

Satu teg pembukaan boleh mengandungi berbilang atribut, contohnya:

Saiz dan warna teks yang ditentukan

Sejarah perkembangan bahasa markup.

Konsep hiperteks telah diperkenalkan oleh W. Bush pada tahun 1945, dan bermula pada tahun 60-an, aplikasi pertama menggunakan data hiperteks mula muncul. Walau bagaimanapun, teknologi ini menerima perkembangan utamanya apabila timbul keperluan sebenar untuk mekanisme untuk menggabungkan pelbagai sumber maklumat, memberikan keupayaan untuk mencipta dan melihat teks bukan linear.

Pada tahun 1986, ISO meluluskan Standardized Generalized Markup Language. Bahasa ini bertujuan untuk mencipta bahasa penanda lain; ia mentakrifkan set teg yang sah, atributnya dan struktur dalaman dokumen. Oleh itu, adalah mungkin untuk membuat tag anda sendiri yang berkaitan dengan kandungan dokumen. Kini menjadi jelas bahawa dokumen sedemikian sukar untuk ditafsir tanpa definisi bahasa penanda, yang disimpan dalam Definisi Jenis Dokumen (DTD). DTD mengumpulkan semua peraturan bahasa dalam standard SGML. Dalam erti kata lain, DTD menerangkan hubungan teg antara satu sama lain dan peraturan penggunaannya. Selain itu, untuk setiap kelas dokumen, set peraturannya sendiri ditakrifkan yang menerangkan tatabahasa bahasa penanda yang sepadan. Oleh itu, hanya dengan bantuan DTD seseorang boleh mengesahkan penggunaan tag yang betul dan, oleh itu, ia mesti dihantar bersama dokumen SGML atau dimasukkan ke dalam dokumen.

Pada masa itu, sebagai tambahan kepada SGML, terdapat beberapa bahasa lain yang serupa bersaing antara satu sama lain, tetapi populariti (HTML, yang merupakan salah satu keturunannya) memberikan SGML kelebihan yang tidak dapat dinafikan berbanding rakan sejawatannya.

Menggunakan SGML, anda boleh menerangkan data berstruktur, menyusun maklumat yang terkandung dalam dokumen dan membentangkan maklumat ini dalam beberapa format piawai. Tetapi kerana kerumitannya, SGML digunakan terutamanya untuk menerangkan sintaks bahasa lain, dan beberapa aplikasi berfungsi dengan dokumen SGML secara langsung. SGML biasanya digunakan hanya dalam projek besar, contohnya, untuk mencipta sistem pengurusan dokumen bersatu untuk syarikat besar.

Bahasa penanda HTML adalah lebih mudah dan lebih mudah daripada SGML, arahannya terutamanya bertujuan untuk mengawal proses memaparkan kandungan dokumen pada skrin. HTML sebagai cara untuk menandakan dokumen teknikal telah dicipta oleh Tim Berners-Lee pada tahun 1991 khusus untuk komuniti saintifik. Ia pada asalnya hanyalah salah satu daripada aplikasi SGML.

Walaupun fakta bahawa satu-satunya perkara yang boleh dilakukan oleh HTML ialah mengklasifikasikan bahagian dokumen dan memastikan paparan yang betul dalam penyemak imbas, ia adalah bahasa penanda yang paling popular. Ini kerana HTML agak mudah dipelajari. Apa yang anda perlu lakukan ialah mempelajari arahan HTML. DTD untuk HTML disimpan dalam penyemak imbas. Di samping itu, perlu diingatkan bahawa HTML direka untuk berfungsi pada pelbagai jenis platform. Tetapi ia mempunyai beberapa batasan penting:

  1. HTML mempunyai set teg tetap, dan set ini tidak boleh dikembangkan atau diubah;
  2. Teg bahasa HTML menunjukkan hanya bagaimana data harus dipersembahkan, iaitu penampilan dokumen. HTML tidak membawa maklumat tentang maksud kandungan yang terkandung dalam teg atau struktur dokumen.

Piawaian mentakrifkan dua tahap ketepatan untuk dokumen XML:

  • Dibina dengan betul(Berbentuk elok). Dokumen yang dibentuk dengan baik mengikut semua peraturan am sintaks XML yang digunakan pada mana-mana dokumen XML. Dan jika, sebagai contoh, teg permulaan tidak mempunyai teg akhir yang sepadan, maka ini dibina secara tidak betul dokumen XML. Dokumen yang tidak dibina dengan betul tidak boleh dianggap sebagai dokumen XML; Pemproses XML (penghuraikan) tidak seharusnya memprosesnya secara normal dan harus mengklasifikasikan keadaan sebagai ralat maut.
  • sah(Sah). Dokumen yang sah juga mematuhi peraturan semantik tertentu. Ini lebih tegas pengesahan tambahan ketepatan dokumen untuk pematuhan dengan peraturan yang telah ditetapkan, tetapi sudah luaran, untuk meminimumkan bilangan ralat, sebagai contoh, struktur dan komposisi dokumen tertentu atau keluarga dokumen tertentu. Peraturan ini boleh dibangunkan oleh pengguna sendiri dan pemaju pihak ketiga, sebagai contoh, pembangun kamus atau piawaian pertukaran data. Biasanya, peraturan sedemikian disimpan dalam fail khas - gambar rajah, di mana struktur dokumen, semua nama sah elemen, atribut, dan banyak lagi diterangkan secara terperinci. Dan jika dokumen, sebagai contoh, mengandungi nama elemen yang tidak ditakrifkan sebelum ini dalam skema, maka dokumen XML dianggap batal; Apabila menyemak pematuhan peraturan dan skema, pemproses XML yang menyemak (pengesah) diwajibkan (atas pilihan pengguna) untuk melaporkan ralat.

Kedua-dua konsep ini tidak mempunyai terjemahan piawai yang mantap ke dalam bahasa Rusia, terutamanya konsepnya sah, yang juga boleh diterjemahkan sebagai sah, sah, boleh dipercayai, sesuai, atau pun diuji untuk pematuhan peraturan, piawaian, undang-undang. Sesetengah pengaturcara menggunakan kertas surih yang mantap dalam kehidupan seharian " sah».

Sintaks XML

Bahagian ini hanya membincangkan pembinaan yang betul Dokumen XML, iaitu, sintaksnya.

XML ialah struktur hierarki yang direka untuk menyimpan sebarang data; secara visual struktur boleh diwakili sebagai pokok. Keperluan sintaksis mandatori yang paling penting ialah dokumen itu hanya mempunyai satu unsur akar(unsur akar) (secara alternatif dipanggil elemen dokumen). Ini bermakna teks atau data lain bagi keseluruhan dokumen mesti terletak di antara hanya satu tag akar permulaan dan tag akhir yang sepadan.

Seterusnya contoh paling mudah- dokumen XML yang dibentuk dengan baik: Ini adalah buku: "Buku Kecil" Baris pertama dokumen XML dipanggil pengisytiharan XML(Pengisytiharan XML) ialah rentetan pilihan yang menunjukkan versi standard XML (biasanya 1.0), dan mungkin juga termasuk pengekodan aksara dan kebergantungan luaran. Spesifikasi memerlukan pemproses XML untuk menyokong pengekodan Unicode UTF-8 dan UTF-16 (UTF-32 adalah pilihan). Pengekodan lain berdasarkan piawaian ISO/IEC 8859 diiktiraf sebagai boleh diterima, disokong dan digunakan secara meluas (tetapi tidak diperlukan); pengekodan lain juga boleh diterima, contohnya, Windows-1251 Rusia, KOI-8.

Satu komen boleh diletakkan di mana-mana di dalam pokok. Komen XML diletakkan di dalam sepasang tag . Dua tanda sempang (--) tidak boleh digunakan di mana-mana dalam ulasan.

Di bawah adalah contoh yang mudah resepi masakan, ditandakan menggunakan XML:

Roti ringkas tepung Yis Air suam garam

Struktur

Selebihnya dokumen XML ini terdiri daripada bersarang elemen, beberapa daripadanya mempunyai sifat-sifat Dan kandungan. unsur biasanya terdiri daripada teg pembukaan dan penutup yang melampirkan teks dan elemen lain. Tag pembukaan terdiri daripada nama elemen dalam kurungan sudut, contohnya, " »; tag penutup terdiri daripada nama yang sama dalam kurungan sudut, tetapi garis miring ke hadapan ditambah sebelum nama, contohnya, “ ». Kandungan unsur(kandungan) ialah segala-galanya yang terletak di antara teg pembukaan dan penutup, termasuk teks dan elemen lain (bersarang). Di bawah ialah contoh elemen XML yang mengandungi teg pembuka, teg akhir dan kandungan elemen:

Uli lagi, letak di atas loyang dan masukkan ke dalam ketuhar.

tepung

Dalam contoh di atas, elemen ramuan mempunyai dua atribut: jumlah, yang mempunyai nilai 3, dan unit, yang mempunyai kaca nilai. Dari sudut pandangan penanda XML, atribut di atas tidak mempunyai apa-apa makna, tetapi hanyalah satu set aksara.

Selain teks, elemen boleh mengandungi elemen lain:

Campurkan semua bahan dan uli hingga sebati. Tutup dengan kain dan biarkan selama satu jam di dalam bilik yang hangat. Uli lagi, letak di atas loyang dan masukkan ke dalam ketuhar.

Dalam kes ini, elemen Arahan mengandungi tiga elemen langkah. XML tidak membenarkan elemen bertindih. Sebagai contoh, coretan berikut tidak betul kerana elemen "em" dan "kuat" bertindih.

Biasa beraksen ditonjolkan dan beraksen berdedikasi

Setiap dokumen XML mesti mengandungi tepat satu unsur akar(elemen akar atau elemen dokumen), jadi serpihan berikut tidak boleh dianggap sebagai dokumen XML yang sah.

Entiti #1 Entiti #2

Untuk menandakan unsur tanpa kandungan, dipanggil unsur kosong, perlu memohon bentuk khas entri yang terdiri daripada tag tunggal di mana garis miring diletakkan selepas nama elemen. Jika elemen tidak diisytiharkan kosong dalam DTD, tetapi ia tidak mempunyai kandungan dalam dokumen, untuknya dibenarkan gunakan bentuk rakaman ini. Sebagai contoh:

XML mentakrifkan dua kaedah untuk menulis aksara khas: rujukan entiti dan rujukan aksara. Intipati(entiti) dalam XML merujuk kepada data bernama, biasanya teks, khususnya aksara khas. Rujukan entiti(rujukan entiti) dinyatakan di tempat di mana entiti itu sepatutnya berada dan terdiri daripada ampersand (“&”), nama entiti dan koma bertitik (“;”). Terdapat beberapa entiti yang dipratentukan dalam XML, seperti "lt" (anda boleh merujuknya dengan menulis "< ») для левой угловой скобки и « amp » (ссылка - « & ») для амперсанда, возможно также определять собственные сущности. Помимо записи с помощью сущностей watak individu, ia boleh digunakan untuk merakam blok teks yang kerap berlaku. Di bawah ialah contoh menggunakan entiti yang dipratentukan untuk mengelak daripada menggunakan ampersand dalam nama:

AT&T

Senarai lengkap entiti pratakrif terdiri daripada & (“&”),< («<»), >(">"), " (""), dan " ("") - dua yang terakhir berguna untuk menulis pembatas dalam nilai atribut. Anda boleh menentukan entiti anda dalam dokumen DTD.

Kadang-kadang adalah perlu untuk menentukan ruang yang tidak pecah, yang sangat kerap digunakan dalam HTML dan ditunjukkan seperti dalam XML tidak ada entiti yang dipratentukan sedemikian, ia ditulis, dan penggunaannya menyebabkan ralat. Ketiadaan entiti yang sangat biasa ini selalunya mengejutkan ramai pengaturcara, dan ini menimbulkan beberapa kesukaran apabila memindahkan perkembangan HTML mereka kepada XML.

Pautan mengikut nombor simbol(rujukan aksara angka) kelihatan seperti rujukan kepada entiti, tetapi bukannya nama entiti, aksara # dan nombor (dalam tatatanda perpuluhan atau heksadesimal) ditentukan, iaitu nombor aksara dalam jadual kod Unicode. Ini biasanya aksara yang tidak boleh dikodkan secara langsung, seperti huruf Arab dalam dokumen yang dikodkan ASCII. Ampersand boleh diwakili seperti berikut:

AT&T

Terdapat banyak lagi peraturan mengenai menulis dokumen XML yang sah, tetapi tujuan tinjauan ringkas ini hanyalah untuk menunjukkan asas yang diperlukan untuk memahami struktur dokumen XML.

cerita

Tahun kelahiran XML boleh dianggap 1996, pada penghujungnya versi draf spesifikasi bahasa muncul, atau apabila spesifikasi ini diluluskan. Semuanya bermula dengan kemunculan bahasa SGML pada tahun 1986.

SGML (Standard Generalised Bahasa penanda- standard bahasa umum markup) telah mengisytiharkan dirinya sebagai bahasa meta yang fleksibel, komprehensif dan komprehensif untuk mencipta bahasa markup. Walaupun konsep hiperteks muncul pada tahun 1965 (dan prinsip asas telah dirumuskan pada tahun 1945), SGML tidak mempunyai model hiperteks. Penciptaan SGML boleh dipanggil dengan yakin sebagai percubaan untuk menerima kehebatan, kerana ia menggabungkan keupayaan yang sangat jarang digunakan bersama-sama. Ini adalah kelemahan utamanya - kerumitan dan, sebagai akibatnya, kos tinggi bahasa ini mengehadkan penggunaannya sahaja syarikat besar yang mampu membeli perisian yang sesuai dan mengupah pakar bergaji tinggi. Selain itu, di syarikat kecil Jarang sekali masalah timbul yang begitu kompleks sehingga SGML diperlukan untuk menyelesaikannya.

SGML paling banyak digunakan untuk mencipta bahasa penanda lain; dengan bantuannya bahasa penanda dokumen hiperteks telah dicipta - HTML, spesifikasi yang telah diluluskan pada tahun 1992. Penampilannya dikaitkan dengan keperluan untuk mengatur susunan dokumen yang semakin meningkat di Internet. Pertumbuhan pesat dalam bilangan sambungan ke Internet dan, oleh itu, pelayan Web memerlukan keperluan untuk pengekodan dokumen elektronik yang tidak dapat ditangani oleh SGML kerana kesukaran pembangunan yang tinggi. Kemunculan HTML, bahasa penanda yang sangat mudah, dengan cepat menyelesaikan masalah ini: kemudahan pembelajaran dan kekayaan alat reka bentuk dokumen menjadikannya bahasa yang paling popular untuk pengguna Internet. Tetapi apabila bilangan dan kualiti dokumen di Web meningkat, begitu juga keperluan yang diletakkan pada mereka, dan kesederhanaan HTML menjadi kelemahan utamanya. Bilangan teg yang terhad dan sikap acuh tak acuh sepenuhnya terhadap struktur dokumen mendorong pembangun yang diwakili oleh konsortium W3C untuk mencipta bahasa penanda yang tidak sekompleks SGML dan tidak seprimitif HTML. Akibatnya, menggabungkan kesederhanaan HTML dengan logik penanda SGML dan memenuhi permintaan Internet, XML dilahirkan.

Kelebihan dan kekurangan

Kelebihan

Kecacatan

  • Kekaburan pemodelan.
  • XML tidak mempunyai sokongan jenis data terbina dalam bahasa. Ia tidak mempunyai penaipan yang ketat, iaitu konsep "integer", "rentetan", "tarikh", " nilai boolean" dan lain-lain.
  • Model data hierarki yang ditawarkan oleh XML adalah terhad berbanding model hubungan dan model data rangkaian dan graf berorientasikan objek.

Memaparkan XML di World Wide Web

Tiga cara paling biasa untuk menukar dokumen XML kepada bentuk yang boleh dipaparkan pengguna ialah:

  1. Menggunakan gaya CSS;
  2. Menggunakan transformasi XSLT;
  3. Menulis pengendali dokumen XML dalam mana-mana bahasa pengaturcaraan.

Tanpa menggunakan CSS atau XSL, dokumen XML muncul sebagai teks biasa dalam kebanyakan pelayar Web. Sesetengah pelayar seperti Internet Explorer, Mozilla dan Mozilla Firefox memaparkan struktur dokumen dalam paparan pokok, membolehkan anda meruntuhkan dan mengembangkan nod dengan klik tetikus.

Menggunakan Gaya CSS

Proses ini serupa dengan menggunakan CSS pada dokumen HTML untuk paparan.

Untuk menggunakan CSS Apabila dipaparkan dalam penyemak imbas, dokumen XML mesti mengandungi pautan khas ke helaian gaya. Sebagai contoh:

Ini berbeza daripada pendekatan HTML, yang menggunakan elemen .

Mengaplikasikan transformasi XSLT

XSL ialah teknologi yang menerangkan cara memformat atau mengubah data dokumen XML. Dokumen diubah menjadi format yang sesuai untuk dipaparkan dalam penyemak imbas. Penyemak imbas ialah penggunaan XSL yang paling biasa, tetapi jangan lupa bahawa dengan XSL anda boleh mengubah XML ke dalam sebarang format, mis.

Kami meneruskan kajian XML kami sekali lagi dan dalam artikel ini kami akan berkenalan dengan binaan XML seperti arahan pemprosesan, ulasan, atribut dan elemen XML lain. Elemen ini adalah asas dan membolehkan anda secara fleksibel, mengikut piawaian, menanda dokumen yang mempunyai sebarang kerumitan.

Kami telah membincangkan sebahagiannya beberapa perkara, seperti teg XML, dalam artikel sebelumnya "". Sekarang kita akan menyentuh topik ini sekali lagi dan menelitinya dengan lebih terperinci. Ini dilakukan secara khusus untuk memudahkan anda mendapatkan gambaran penuh binaan XML.

Elemen XML. Elemen XML kosong dan tidak kosong

Seperti yang dinyatakan dalam artikel sebelumnya, teg dalam XML tidak hanya menandakan teks, seperti yang berlaku dalam HTML, tetapi menyerlahkan elemen individu (objek). Seterusnya, elemen menyusun maklumat secara hierarki dalam dokumen, yang seterusnya menjadikannya unit struktur utama bahasa XML.

Dalam XML, elemen boleh terdiri daripada dua jenis - kosong dan tidak kosong. Elemen kosong tidak mengandungi sebarang data, seperti teks atau binaan lain. Tidak seperti elemen kosong, elemen bukan kosong boleh mengandungi sebarang data, seperti teks atau elemen dan binaan XML lain. Untuk memahami perkara di atas, mari lihat contoh elemen XML kosong dan tidak kosong.

Elemen XML kosong

Unsur XML bukan kosong

Kandungan unsur...

Seperti yang dapat kita lihat daripada contoh di atas, perbezaan utama antara elemen kosong dan tidak kosong ialah ia terdiri daripada satu tag sahaja. Di samping itu, ia juga perlu diperhatikan bahawa dalam XML semua nama adalah sensitif huruf besar. Ini bermakna bahawa nama myElement, MyElement, MYELEMENT, dll. berbeza antara satu sama lain, oleh itu masa ini Perlu diingat dengan segera untuk mengelakkan kesilapan pada masa hadapan.
Jadi, kami mengetahui unsur-unsurnya. Sekarang mari kita beralih ke perkara seterusnya seperti organisasi logik dokumen XML.

Organisasi logik dokumen XML. Struktur pokok data XML

Seperti yang anda ingat, binaan utama bahasa XML ialah elemen, yang boleh mengandungi binaan bersarang lain dan dengan itu membentuk struktur hierarki pemandangan pokok. Dalam kes ini, elemen induk akan menjadi akar dan semua yang lain elemen kanak-kanak akan menjadi dahan dan daun pokok XML.

Untuk memudahkan pemahaman di atas, mari kita lihat gambar berikut dengan contoh.

Seperti yang kita dapat lihat, menyusun dokumen XML sebagai pokok adalah struktur yang agak mudah untuk diproses. Pada masa yang sama, kerumitan ekspresif pokok itu sendiri agak hebat. Perwakilan pokok ialah cara yang paling optimum untuk menerangkan objek dalam XML.

Atribut XML. Peraturan untuk menulis atribut dalam XML

Dalam XML, elemen juga boleh mengandungi atribut dengan nilai yang diberikan kepada mereka, yang diletakkan dalam petikan tunggal atau berganda. Atribut untuk elemen ditetapkan seperti berikut:

Dalam kes ini, atribut dengan nama "atribut" dan nilai "nilai" telah digunakan. Perlu diperhatikan dengan segera bahawa atribut XML mesti mengandungi beberapa nilai dan tidak boleh kosong. Jika tidak, kod itu akan menjadi salah dari sudut pandangan XML.

Ia juga bernilai memberi perhatian kepada penggunaan tanda petikan. Nilai atribut boleh disertakan dalam petikan tunggal atau berganda. Di samping itu, ia juga mungkin untuk menggunakan beberapa petikan di dalam yang lain. Untuk menunjukkan, pertimbangkan contoh berikut.

Sebelum kita melihat binaan XML lain, ia juga perlu diperhatikan bahawa apabila mencipta atribut, perkara berikut tidak boleh digunakan sebagai nilai: Simbol khas, seperti ampersand "&" atau kurungan sudut "<>" Aksara ini dikhaskan sebagai aksara kawalan (“&” ialah entiti, dan “<» и «>" buka dan tutup tag elemen) dan tidak boleh digunakan dalam " bentuk tulen" Untuk menggunakannya, anda perlu menggantikan aksara khas.

Arahan pemprosesan XML (arahan pemprosesan). pengisytiharan XML

XML mempunyai keupayaan untuk memasukkan arahan dalam dokumen yang membawa maklumat khusus untuk aplikasi yang akan memproses dokumen tertentu. Arahan pemprosesan dalam XML dicipta seperti berikut.

Seperti yang dapat dilihat daripada contoh di atas, dalam arahan XML untuk pemprosesan disertakan dalam tanda petikan sudut dengan tanda soal. Ini agak seperti biasa yang kami lihat dalam pelajaran PHP pertama. Bahagian pertama arahan pemprosesan menentukan aplikasi atau sistem yang bertujuan untuk bahagian kedua arahan ini atau kandungannya. Walau bagaimanapun, arahan pemprosesan hanya sah untuk aplikasi yang dialamatkan. Contoh arahan pemprosesan boleh menjadi arahan berikut.

Perlu diingat bahawa XML mempunyai binaan khas yang hampir sama dengan arahan pemprosesan, tetapi ia sendiri bukanlah satu. Ia mengenai tentang pengisytiharan XML, yang menyampaikan kepada perisian pemprosesan beberapa maklumat tentang sifat dokumen XML, seperti pengekodan, versi bahasa di mana dokumen itu ditulis, dsb.

Seperti yang anda boleh lihat daripada contoh di atas, pengisytiharan XML mengandungi apa yang dipanggil pseudo-atribut, yang hampir sama dengan atribut biasa yang kita bincangkan di atas. Hakikatnya, mengikut definisi, pengisytiharan XML dan arahan pemprosesan tidak boleh mengandungi atribut, jadi pengisytiharan ini dipanggil pseudo-atribut. Ini wajar diingati untuk masa hadapan bagi mengelakkan pelbagai kesilapan.

Memandangkan kita telah berurusan dengan pseudo-atribut, mari kita lihat apa yang mereka maksudkan.

  • Pengekodan – bertanggungjawab untuk pengekodan dokumen XML. Biasanya pengekodan UTF8 digunakan.
  • Versi – versi bahasa XML di mana dokumen ini ditulis. Biasanya ini ialah XML versi 1.0.

Nah, sekarang mari kita beralih ke bahagian penutup artikel dan pertimbangkan binaan XML seperti bahagian komen dan CDATA.

Buku ini mengandungi petua, algoritma dan contoh siap sedia program dari pelbagai kawasan: penyulitan, operasi fail dan rangkaian, XML, ASP.NET, interaksi dengan MS Office dan Internet Explorer, dsb. Sintaks bahasa C#, isu penyahpepijatan dan aplikasi pemprofilan, serta masalah yang timbul apabila menukar dari bahasa lain diterangkan pengaturcaraan dalam bahasa C#. Contoh yang paling biasa digunakan ungkapan biasa. Bab yang berasingan dikhaskan untuk bekerja dengan peralatan.
Arkib mengandungi buku itu sendiri dan CD dengan kod sumber.

Manual ini bertujuan untuk pengaturcara yang mula dan terus mempelajari Java SE, JEE dan teknologi lain. Bahagian pertamanya merangkumi perkara asas bahasa Jawa dan konsep pengaturcaraan berorientasikan objek. Bahagian kedua merangkumi aspek penggunaan perpustakaan kelas Java, termasuk fail, koleksi, rangkaian dan aplikasi berbilang benang, dan interaksi dengan XML. Bahagian ketiga menyediakan asas pengaturcaraan sistem maklumat teragih menggunakan servlet, JSP dan tag pembangun sendiri. Bahagian keempat memberikan asas permohonan praktikal corak reka bentuk.
Pada akhir setiap bab, soalan ujian diberikan mengenai bahan dalam bab dan tugasan yang perlu diselesaikan.
Lampiran menyediakan bahan tambahan yang berkaitan dengan penggunaan UML, SQL, Ant, XML, serta penerangan ringkas tentang teknologi popular Log4J, JUnit, JPA dan Hibernate.

Penerangan buku XML terbuka adalah pendek dan boleh diakses:
Buku ini menyediakan gambaran keseluruhan yang mendalam tentang tiga bahasa penanda utama standard Open XML. Buku ini ditujukan untuk pembaca yang biasa dengan XML atau HTML. Arkitek dan pembangun perisian membina penyelesaian tertumpu pada dokumen akan mempelajari cara membina penyelesaian tersebut pada platform Open XML.

Buku ini berguna untuk mereka yang baru menggunakan bahasa penanda dan untuk pakar dalam bidang yang tidak biasa dengan Open XML.

Penerangan buku Aplikasi dan Struktur Lanjutan dalam Pemprosesan Xml: Strim Label, Penggunaan Semantik dan Teknologi Pertanyaan Data:
Aplikasi dan Struktur dalam Pemprosesan XML: Aliran Label, Penggunaan Semantik dan Teknologi Pertanyaan Data mencerminkan hasil penyelidikan penting dan penemuan terkini sarjana di seluruh dunia, berusaha untuk meneroka dan mengembangkan peranan XML. Koleksi ini mewakili pemahaman tentang teknologi pemprosesan XML berkaitan dengan kedua-dua aplikasi termaju dan teknologi pemprosesan XML terkini yang merupakan kepentingan utama. Ia memberi peluang untuk memahami topik secara terperinci dan menemui penyelidikan XML pada tahap yang komprehensif.

Penerangan buku XML: Pembangunan Aplikasi Web:
Buku itu mencadangkan Penerangan penuh Bahasa XML digabungkan dengan bahasa XSLT dan XPath, dibentangkan dalam bahagian pertama. Bahagian kedua buku ini mengandungi panduan praktikal mengenai aplikasi bahan yang dibentangkan dalam bahagian pertama buku. Selain XML, isu yang timbul semasa membina aplikasi Web sebenar ditangani, iaitu, menghantar parameter permintaan HTTP ke pelayan, mereka bentuk borang, mempersembahkan data menggunakan helaian gaya berlatarkan dan memproses tindakan pengguna menggunakan JavaScript.

Bahagian I. XML dari A hingga Z

  • bahasa XML
  • bahasa XSLT
  • bahasa XPath
  • Contoh kompleks
  • Tambahan yang diperlukan

Bahagian II. Pembangunan praktikal aplikasi web

  • Alat untuk membuat aplikasi Web
  • Cascading Style Sheets
  • Metodologi pemprosesan data
  • Persembahan data

Penerangan buku Python & XML:
Jika anda seorang pengaturcara Python yang ingin memasukkan XML ke dalam set kemahiran anda, ini adalah buku untuk anda. Python telah menarik pelbagai jenis pembangun, yang menggunakannya sama ada sebagai gam untuk menyambung tugas pengaturcaraan kritikal bersama-sama, atau sebagai merentas platform yang lengkap pembangunan aplikasi bahasa. Namun, kerana ia berorientasikan objek dan mempunyai kebolehan manipulasi teks yang kuat, Python adalah ideal bahasa untuk memanipulasi XML.

Python & XML memberi anda asas yang kukuh untuk menggunakan kedua-dua bahasa ini bersama-sama. Sarat dengan contoh praktikal, jilid baharu ini menyerlahkan tugas aplikasi biasa, supaya awak boleh belajar dengan melakukan. Buku ini bermula dengan asas kemudian cepat berkembang ke topik yang kompleks, seperti menukar XML dengan XSLT, menanyakan XML dengan XPath dan bekerja dengan dialek dan pengesahan XML. Ia juga meneroka isu yang lebih maju: menggunakan Python dengan SOAP dan perkhidmatan web yang diedarkan, dan menggunakan Python untuk mencipta aliran berskala antara aplikasi yang diedarkan (seperti pangkalan data dan pelayan web).

Buku ini menyediakan aplikasi praktikal yang berkesan, sambil merujuk banyak alat yang terlibat dalam pemprosesan XML dan Python, dan menyerlahkan isu merentas platform bersama dengan tugas yang berkaitan dengan pengkomputeran perusahaan. Anda akan mendapat liputan yang mencukupi bagi analisis aliran XML dan butiran tentang cara anda boleh mengangkut XML melalui rangkaian anda.

Sama ada anda menggunakan Python sebagai bahasa aplikasi, atau sebagai bahasa skrip pentadbiran atau middleware, anda pasti mendapat manfaat daripada buku ini. Jika anda ingin menggunakan Python untuk memanipulasi XML, ini adalah panduan anda.

Penerangan buku Bible XML:
Kemunculan XML memberi impak yang besar pada pembangunan Web, dan penskalaan keluk pembelajaran teknologi baharu ini adalah keutamaan bagi kebanyakan pembangun. XML Bible menawarkan pengenalan hebat kepada subjek dan asas untuk memahami perkembangan masa depan XML.

Pengarang Elliotte Rusty Harold menggunakan perbincangan langkah demi langkah yang sabar yang menunjukkan dengan jelas potensi XML tanpa membosankan pembacanya dengan banyak SGML spec-speak. Harold membuka dengan cepat dengan contoh "Hello World" untuk mendapatkan pengekodan pembaca lebih awal, dan mengikutinya dengan contoh mudah tetapi berkesan tentang faedah pengurusan data XML—membentangkan statistik besbol. Sebaik sahaja anda mengekodkan yang pertama anda dokumen XML, anda akan terpikat dengan teknologi dan bermotivasi untuk belajar tentang topik yang lebih canggih.

Bahasa helaian gaya diliputi secara menyeluruh untuk menggambarkan kemungkinan persembahan dan perangkap. Senarai aplikasi XML kehidupan sebenar yang luar biasa panjang juga menunjukkan cara XML telah digunakan, dan terdapat liputan mendalam Rangka Kerja Penerangan Sumber, Format Definisi Saluran dan Bahasa Penanda Vektor. Buku ini diakhiri dengan bahagian yang membantu anda mereka bentuk aplikasi XML anda sendiri dari awal.

Penerangan buku XSLT. Koleksi resipi:
Bahasa XSLT (Extensible Stylesheet Language Transformation) telah menjadi alat utama untuk memproses dokumen XML, tetapi ramai pembangun masih belum menguasainya sepenuhnya dan oleh itu percaya bahawa lebih mudah untuk mengubah suai kod sedia ada daripada menulis kod baharu dari awal. Dalam versi 2.0, banyak masalah telah diselesaikan, tetapi terdapat beberapa ciri baharu yang masih perlu diterokai. Di samping itu, ia masih belum cukup disokong.

Edisi kedua buku ini mengandungi beratus-ratus penyelesaian kepada masalah yang sering dihadapi oleh pengaturcara. Pilihan diberikan untuk kedua-dua versi XSLT. Julat resipi sangat luas: daripada operasi rentetan dan pengiraan matematik hingga topik yang sukar, seperti memanjangkan XSLT, menguji dan menyahpepijat helaian gaya serta mencipta grafik SVG. Setiap resipi mewajarkan pilihan penyelesaian dan menerangkan teknik yang digunakan. Untuk banyak masalah ada penyelesaian alternatif dengan ulasan mengenai kebolehgunaan dan prestasi.

Menawarkan resipi yang direka untuk tahap yang berbeza kelayakan, buku ini akan menjadi teman yang ideal untuk pengaturcara yang suka belajar melalui teladan. Tidak kira sama ada anda mencuba XSLT buat kali pertama atau sudah biasa dengan bahasa ini dan ingin mempunyai pilihan resipi siap sedia untuk menyelesaikan masalah yang rumit, di dalamnya anda akan mendapati yang paling banyak. cara yang berbeza aplikasi XSLT.

Penerangan buku Pembelajaran XML:
Penerbitan ini didedikasikan untuk bahasa penanda yang boleh diperluaskan XML - yang menjanjikan dan alat yang berkuasa, yang menyediakan cara yang fleksibel untuk membuat dokumen pendokumentasian sendiri dan perkongsian kedua-dua format dan data di Internet. Sejarah disemak keadaan sekarang dan cabaran XML, isu asas. Untuk pembangun permulaan, asas teknik pembuatan dokumen XML dan konsep elemen XML, atribut, entiti dan ruang nama diliputi. Isu kompleks ditujukan kepada profesional - transformasi, pemodelan dokumen, penalaan halus templat, pengaturcaraan XML, menggunakan pautan dan helaian gaya berlatarkan.

Buku ini menunjukkan dengan contoh cara menggunakan XML dengan berkesan dengan memformat dan mengubah dokumen XML supaya ia boleh diproses oleh penyemak imbas, pangkalan data dan sebagainya. Bahan ini disertakan dengan pautan ke projek sebenar. Lampiran menerangkan sumber Internet, buku dan piawaian yang berkaitan dengan XML. Glosari disertakan dalam buku.

Penerangan buku XML. Direktori:
Rujukan XML ialah sumber maklumat untuk pembangun dalam dunia XML yang berkembang pesat. Setelah pembaca memahami piawaian teras XML, mereka boleh memahami dengan cepat selok-belok DTD, ruang nama, ketepatan dokumen XML dan sokongan Unicode.

Salah satu hala tuju yang paling tidak dijangka dalam pembangunan XML ialah penggunaan aktifnya untuk bekerja dengan dokumen berstruktur: jadual elektronik dan matematik, laporan statistik dan kewangan serta fail perisian.

Gambaran keseluruhan teknologi utama yang digunakan terutamanya untuk dokumen XML naratif seperti halaman web, buku dan artikel akan membantu anda memperoleh pengetahuan tentang XSLT, XPath, XLink, XPointer, CSS dan XSL-FO. Pasti ramai yang berminat menggunakan XML untuk pemprosesan data yang intensif.

Beberapa bab merangkumi utiliti dan API yang diperlukan untuk menulis program pemprosesan XML, seperti SAX, API mudah untuk XML dan DOM, Model Objek Dokumen W3C.

Buku ini juga termasuk bahan yang menjadi asas kepada mana-mana buku rujukan O"Reilly. Bab ini menyediakan peraturan sintaks terperinci (disertai dengan contoh) teknologi XML utama, termasuk DTD, XPath, XSLT, SAX dan DOM. Rujukan ini menerangkan peraturan bahawa Pengarang semua dokumen XML harus mematuhi perkara ini, kedua-dua pereka web mencipta animasi menggunakan pengaturcara SMIL dan C++ menggunakan SOAP untuk menyerikan objek ke pangkalan data jauh.

Hari ini kita akan mula mempertimbangkan yang sangat popular dan mudah bahasa penanda XML. Memandangkan format untuk mempersembahkan data ini sangat fleksibel dan universal, dan ia boleh digunakan hampir di mana-mana, ini bermakna dengan teliti dengan sesuatu. Oleh itu, pengaturcara baru lambat laun perlu berurusan dengan bahasa ini, dan tidak kira apa sebenarnya yang anda lakukan, sama ada pengaturcaraan web atau pentadbiran pangkalan data, kerana semua orang menggunakan XML, dan anda juga akan menggunakannya untuk melaksanakan tugasan. awak perlu.

Kita akan mulakan, seperti biasa, dengan teori, mari kita lihat apa jenis bahasa itu, mengapa ia bagus, bagaimana untuk menggunakannya dan di mana ia digunakan.

Definisi Bahasa XML

XML (Extensible Markup Language) ialah bahasa penanda data universal dan boleh diperluaskan yang bebas daripada sistem pengendalian dan persekitaran pemprosesan. Xml digunakan untuk membentangkan data tertentu dalam bentuk struktur, dan anda boleh membangunkan struktur ini sendiri atau menyesuaikannya untuk program atau perkhidmatan tertentu. Itulah sebabnya bahasa yang diberikan Mereka memanggilnya boleh dikembangkan, dan ini adalah kelebihan utamanya, yang mana ia sangat dihargai.

Seperti yang anda ketahui, terdapat banyak bahasa penanda, contohnya, bahasa HTML, tetapi semuanya, satu cara atau yang lain, bergantung pada pemproses, contohnya, html yang sama, kod yang dihuraikan oleh penyemak imbas, diseragamkan dan tidak boleh diperluaskan, terdapat teg yang jelas di sana, sintaks yang tidak boleh dilanggar, dan dalam xml anda boleh membuat teg anda sendiri, i.e. markup anda. Perbezaan utama antara HTML dan XML ialah html hanya menerangkan markup untuk memaparkan data, dan xml ialah struktur data abstrak yang boleh diproses dan dipaparkan mengikut kehendak anda dan di mana-mana sahaja, dan oleh itu tidak perlu membandingkan bahasa ini, mereka mempunyai tujuan yang berbeza sama sekali.

Seperti yang dinyatakan di atas, xml adalah sangat biasa dan bahasa sejagat, yang melaluinya hampir semua aplikasi, kedua-dua web dan hanya untuk komputer, menggunakannya sebagai pertukaran maklumat, kerana dengan bantuannya anda boleh bertukar-tukar data dengan mudah antara aplikasi atau perkhidmatan yang ditulis dalam perbezaan bahasa. Dalam hubungan ini, setiap pengaturcara baru yang terlibat dalam sebarang pengaturcaraan harus mempunyai pemahaman tentang XML. Jika anda ingin menjadi master web, maka anda mesti tahu XML, dan kami telah membincangkan cara menjadi Master WEB dan perkara yang perlu anda ketahui untuk ini.

Sebagai contoh, saya pernah mempunyai tugas untuk menulis perkhidmatan tertentu yang harus mengembalikan data dalam bentuk xml atas permintaan, i.e. macam berkembang bahagian pelayan aplikasi, dan saya tidak tahu apa yang ditulis oleh pelanggan yang akan memproses data ini, dan bahawa saya menulis perkhidmatan yang mengembalikan data dalam bentuk xml dan itu sahaja, aplikasi itu berfungsi dengan sempurna. Dan ini hanyalah contoh yang perlu saya tangani, tetapi sekarang bayangkan berapa banyak organisasi yang berbeza bekerjasama dan bersungguh-sungguh membangunkan perisian dan bertukar data, dan saya tidak akan terkejut bahawa data ini akan berada dalam bentuk xml.

Sebagai contoh, saya pernah mempunyai tugas untuk menulis perkhidmatan tertentu yang harus mengembalikan data dalam bentuk xml atas permintaan, i.e. sejenis pembangunan bahagian pelayan aplikasi, dan saya tidak tahu apa yang ditulis oleh pelanggan yang akan memproses data ini, dan bahawa saya menulis perkhidmatan yang mengembalikan data dalam bentuk xml dan itu sahaja, aplikasi itu berfungsi dengan sempurna . Dan ini hanyalah contoh yang perlu saya tangani, tetapi sekarang bayangkan berapa banyak organisasi yang berbeza bekerjasama dan bersungguh-sungguh membangunkan perisian dan bertukar data, dan saya tidak akan terkejut bahawa data ini akan berada dalam bentuk xml.

Saya juga pernah terpaksa menyimpan data xml dalam pangkalan data MS SQL 2008, untuk mewakili data yang sama ini dengan lebih baik dan menukarnya antara pelayan dan bahagian klien aplikasi, kami membincangkannya dalam artikel - Transact-sql - bekerja dengan xml.

Bahasa XML itu sendiri sangat mudah, dan mustahil untuk dikelirukan di dalamnya; semua kerumitan timbul tepat dalam pemprosesan dan interaksi XML dengan aplikasi, teknologi lain, i.e. semua yang mengelilingi xml, di mana anda boleh keliru dengan mudah.

Hari ini kita hanya bercakap tentang asas XML, dan kita tidak akan menumpukan pada teknologi untuk memproses dan berinteraksi dengan bahasa ini, kerana ini benar, bahan yang sangat besar, tetapi saya fikir pada masa hadapan kita akan terus berkenalan dengan teknologi yang berkaitan .

Mari kita teruskan untuk berlatih. Dan saya akan menulis semua contoh yang akan kami pertimbangkan dalam Notepad++ hanya kerana ia sangat mudah, tetapi kami tidak akan membincangkannya sekarang, kerana kami telah membincangkannya dalam artikel - Mengapa Notepad++ bagus untuk pemaju pemula.

tag XML

Bahasa XML menggunakan tag ( tag adalah sensitif huruf besar-besaran), tetapi bukan tag yang sama seperti dalam html, tetapi tag yang anda buat sendiri, tetapi dokumen xml juga mempunyai struktur yang jelas, i.e. terdapat teg pembukaan dan teg penutup, terdapat teg bersarang dan, sudah tentu, terdapat nilai yang terdapat dalam teg ini. Dalam erti kata lain, semua yang anda perlukan pengetahuan asas xml hanyalah untuk mengikuti peraturan ini. Bersama-sama, teg pembuka, penutup dan nilai dipanggil elemen, dan keseluruhan dokumen xml mengandungi tepat elemen yang bersama-sama membentuk struktur data. Dokumen xml hanya boleh mempunyai satu elemen akar, ingat ini, kerana jika anda menulis dua elemen akar, ia akan menjadi ralat.

Dan sudah tiba masanya untuk dibawa contoh xml markup, dan contoh pertama setakat ini untuk sintaks:

<Начало элемента> <Начало вложенного элемента>Nilai elemen bersarang

Seperti yang anda lihat, semuanya agak mudah, dan mungkin terdapat banyak elemen sedemikian bersarang di antara satu sama lain.

Sekarang mari kita berikan contoh dokumen xml sebenar:

Seperti yang anda lihat, saya hanya memberikan contoh jenis katalog buku di sini, tetapi saya tidak mengisytiharkan dokumen ini, i.e. Saya tidak menulis pengisytiharan XML yang memberitahu aplikasi yang akan memproses data ini bahawa data XML terletak di sini dan dalam pengekodan yang dipersembahkan. Anda juga boleh menulis ulasan dan atribut, jadi mari kita berikan contoh dokumen sedemikian:

Buku 1 Ivan Tempah 1 sahaja Buku 2 Sergey Tempah 2 sahaja Buku 3 Novel Tempah 3 sahaja

Di mana baris pertama ialah pengisytiharan bahawa ini ialah dokumen XML dan mesti dibaca dalam pengekodan UTF-8.

Data ini tanpa pemprosesan akan kelihatan, sebagai contoh, dalam penyemak imbas (Mozilla Firefox) seperti berikut:

Saya harap anda faham bahawa di sini katalog ialah elemen akar, yang terdiri daripada elemen buku, yang seterusnya terdiri daripada unsur nama, pengarang dan ulasan, dan sebagai contoh, saya juga menetapkan beberapa atribut untuk elemen katalog dan elemen buku .

Untuk asasnya, saya rasa itu sudah cukup, kerana jika kita menyelam lebih dalam dan lebih mendalam ke dalam XML, dan ke dalam semua teknologi yang dikaitkan dengan bahasa ini, maka artikel ini tidak akan pernah berakhir. Jadi itu sahaja untuk hari ini. Selamat tinggal!