Vulgaarne üksikasjade arhiiv php. Mis on veebiarhiiv ja miks seda vaja on?

Iga sait on lugu, millel on algus ja lõpp. Kuidas aga jälgida projekti kujunemise etappe, selle elutsüklit? Nendel eesmärkidel on olemas spetsiaalne teenus, mida nimetatakse veebiarhiiviks. Selles artiklis räägime selliste ressursside esitlusest, nende kasutamisest ja võimalustest.

Mis on veebiarhiiv ja miks seda vaja on?

Veebiarhiiv on spetsiaalne sait, mis on loodud erinevate Interneti-ressursside kohta teabe kogumiseks. Robot salvestab projektide koopiad automaatselt ja käsitsi, kõik sõltub ainult saidist ja andmekogumissüsteemist.

Praegu on sarnase mehaanika ja ülesannetega mitukümmend saiti. Mõnda neist peetakse erasektoriks, teised on avalikkusele avatud mittetulundusprojektid. Samuti erinevad ressursid üksteisest külastuste sageduse, talletatud info täielikkuse ja saadud ajaloo kasutusvõimaluste poolest.

Nagu mõned eksperdid märgivad, peetakse teabevoo salvestuslehti Web 2.0 oluliseks komponendiks. See tähendab, et osa Interneti arendamise ideoloogiast, mis on pidevas arengus. Kogumise mehaanika on väga kesine, kuid pole enam arenenud meetodeid ega analooge. Veebiarhiivi kasutades saate lahendada mitmeid probleeme: teabe jälgimine aja jooksul, kadunud saidi taastamine, teabe otsimine.

Kuidas veebiarhiivi kasutada?


Nagu eespool märgitud, on veebiarhiiv sait, mis pakub ajaloos teatud tüüpi otsinguteenust. Projekti kasutamiseks peate:

  1. Minge spetsiaalsesse ressurssi (nt web.archive.org).
  2. Sisestage otsinguteave spetsiaalsele väljale. See võib olla domeeninimi või märksõna.
  3. Hankige asjakohaseid tulemusi. See on üks või mitu saiti, millest igaühel on fikseeritud roomamiskuupäev.
  4. Klõpsates kuupäeval, minge vastavasse ressurssi ja kasutage teavet isiklikel eesmärkidel.

Spetsialiseerunud saitidest räägime hiljem projektide ajalooliste kirjete otsimiseks, nii et jääge meiega.

Projektid, mis pakuvad saidi ajalugu


Tänapäeval on mitu projekti, mis pakuvad teenuseid salvestatud koopiate leidmiseks. Siin on mõned neist:

  1. Kõige populaarsem ja nõutuim kasutajate seas on web.archive.org. Esitatud saiti peetakse Internetis vanimaks, selle loomine pärineb 1996. aastast. Teenus kogub andmeid automaatselt ja käsitsi ning kogu teave on majutatud tohututes välismaistes serverites.
  2. Populaarsuselt teine ​​sait on peeep.us. Ressurss on väga huvitav, kuna seda saab kasutada teabevoo koopia salvestamiseks, mis on juurdepääsetav ainult teile. Pange tähele, et projekt töötab kõigi domeeninimedega ja laiendab veebiarhiivide kasutamise piire. Mis puudutab teabe täielikkust, siis esitatud sait ei salvesta pilte ega kaadreid. Alates 2015. aastast on see kantud ka Venemaal keelatud toodete nimekirja.
  3. Eespool kirjeldatule sarnane projekt on archive.is. Erinevused hõlmavad teabe kogumise täielikkust, aga ka võimalust salvestada lehti sotsiaalvõrgustikest. Seega, kui olete postituse või huvitava teabe kaotanud, saate otsida veebiarhiivist.

Võimalus kasutada veebiarhiive

Nüüd teavad kõik, mis on veebiarhiiv ja millised saidid pakuvad teenuseid projektide koopiate salvestamiseks. Kuid paljud ei mõista ikka veel, kuidas esitatud teavet kasutada. Arhiiviandmete võimalusi väljendatakse järgmiselt:

  1. Domeeninime valimine. Pole saladus, et paljud veebihaldurid kasutavad juba täiendatud domeene. Tasub mõista, et kogenud kasutajad ei jälgi mitte ainult sihtparameetreid, vaid ka varasema kasutamise ajalugu. Iga võrgukasutaja tahab teada, mida ta ostab: kas varem oli keelde või sanktsioone, kas projekt oli filtrite all.
  2. Saidi taastamine arhiividest. Mõnikord juhtub katastroof, mis ohustab teie enda projekti olemasolu. Hostimisprofiili õigeaegsete varukoopiate puudumine ja juhuslik viga võivad põhjustada tragöödiat. Kui see juhtub, ärge ärrituge, sest saate kasutada veebiarhiivi. Allpool räägime taastamisprotsessist.
  3. Otsige ainulaadset sisu. Iga päev surevad Internetis sisuga täidetud saidid. See juhtub eriti järjekindlalt, mistõttu läheb kaotsi tohutu teabevoog. Aja jooksul langevad sellised lehed registrist välja ja leidlik veebihaldur saab teavet isikliku projekti jaoks laenata. Muidugi on otsinguprobleem, kuid see on teisejärguline probleem.

Vaatasime põhifunktsioone, mida veebiarhiivid pakuvad, nüüd on aeg liikuda edasi üksikute elementide üksikasjalikuma uurimise juurde.

Veebisaidi taastamine veebiarhiivist

Keegi pole kaitstud veebisaitidega seotud probleemide eest. Enamik neist lahendatakse varukoopiate abil. Aga mis siis, kui hostiserveris pole salvestatud koopiat? Kasutage veebiarhiivi. Selleks peaksite:

  1. Minge spetsiaalsesse ressurssi, millest me varem rääkisime.
  2. Sisestage otsinguribale oma domeeninimi ja avage projekt uues aknas.
  3. Valige kõige edukam foto, mis asub probleemi kuupäevale lähemal ja millel on täielik vaade.
  4. Parandage sisemised lingid otsesteks linkideks. Selleks kasutage linki „http://web.archive.org/web/any_sequence_number_id_/Site name”.
  5. Kopeerige kadunud teave või kujundusandmed taastamiseks.

Pange tähele, et protsess on arhiivi kiirust arvestades mõnevõrra tüütu. Seetõttu soovitame suurte veebiressursside omanikel sagedamini varukoopiaid teha, mis säästab aega ja närve.

Otsime oma veebisaidile ainulaadset sisu


Mõned veebihaldurid kasutavad huvitavat viisi uue sisu hankimiseks, mida keegi ei vaja. Iga päev lähevad sajad saidid unustusehõlma ja koos nendega kaob ka teave. Sisu omanikuks saamiseks peate tegema järgmist.

  1. Sisestage URL
    https://www.nic.ru/auction/forbuyer/download_list.shtml#buying otsinguribal.
  2. Domeeninimede oksjoni veebisaidil laadige alla failid nimega ru.
  3. Avage vastuvõetud failid Exceli abil ja alustage valikut disainiteabe saadavuse alusel.
  4. Sisestage leitud projektid veebiarhiivi otsingulehe loendisse.
  5. Avage hetktõmmis ja avage teabevoogu.

Soovitame jälgida sisu plagiaadi suhtes, see võimaldab teil leida tõeliselt väärt tekste. Ja ongi kõik! Nüüd teavad kõik veebiarhiivi kasutamise võimalustest ja meetoditest. Kasutage teadmisi targalt ja tulusalt.

Interneti-arhiiv pakub üle 15,000,000 tasuta allalaaditavad raamatud ja tekstid. Samuti on kogumik, mida saavad laenata kõik, kellel on saidi tasuta konto.

Teise võimalusena saab meie kaasaskantavat lauaskannerit osta ja kasutada kohapeal raamatukogudes ja arhiivides. Meie TT Scribe'i kohta lisateabe saamiseks külastage veebisaiti.

Alates 2005. aastast on Interneti-arhiiv teinud koostööd ja loonud digitaalseid kogusid üle 1100 raamatukoguasutust ja teised sisupakkujad. Partnerlussuhete hulka kuuluvad: , ja . Need kogud on digiteeritud erinevatest meediatüüpidest, sealhulgas: , ja laiast valikust . Märkimisväärse panuse on andnud partnerid Põhja-Ameerikas (ja raamatukogud) ja , esindades enam kui 184 keelt.


Interneti-arhiiv julgustab meie ülemaailmset kogukonda panustama füüsiliste üksustega, samuti laadima digitaalseid materjale otse Interneti-arhiivi. Kui teil on digitaalseid üksusi, mida soovite Interneti-arhiivi lisada, lisage üleslaadija liidese abil uus üksus. Klõpsake siin, et rakendada konkreetse Creative Commonsi litsentsi Creative Commonsi litsentsi, et teavitada, kuidas materjali saab kasutada.

Füüsiliste raamatute või esemete annetamiseks võtke ühendust info@sait


Tasuta lugeda, alla laadida, printida ja nautida. Mõnel on hulgi taaskasutamise ja ärilise kasutamise piirangud. Vaadake raamatu kogu või sponsorit. Pakkudes neile tekstidele peaaegu piiramatut juurdepääsu, loodame julgustada tekstide laialdast kasutamist uutes kontekstides inimeste poolt, kes ei pruugi neid varem kasutanud.

Kui teil on vaja kiiresti serverist veebisaidi allikaid alla laadida, ei anna isegi suhteliselt kiire SSH tunnel vajalikku kiirust. Ja sa pead ootama väga-väga kaua. Ja paljud hostingu pakkujad ei paku seda juurdepääsu, vaid sunnivad teid leppima FTP-ga, mis on kordades aeglasem.

Enda jaoks isiklikult olen leidnud väljapääsu. Väike skript laaditakse serverisse ja käivitatakse. Mõne aja pärast saame arhiivi kõigi allikatega. Ja üks fail, isegi iidse FTP kaudu, laadib alla palju kiiremini kui sada väikest faili.

Varem selle ajaveebi raamatukogu lehtedel zipArhiiv. Küll aga oli siis küsimus arhiivi lahtipakkimises.

Esiteks peame välja selgitama, kas server toetab zipArchive'i. See populaarne raamatukogu on installitud enamikule hostimissaitidele.

Teek on rangelt piiratud php ja serveri parameetritega. Hiiglaslikke andmebaase ja fotopanku ei saa arhiveerida. Isegi vana hea 1C programmi alused raamatupidamiseks. Näib, et need peaksid sisaldama ainult tekstiandmeid. Kuid mitte.

Soovitan teil kasutada raamatukogu ainult suhteliselt väikeste saitide arhiveerimisel, kus on palju väikeseid faile.

Kontrollime, kas raamatukogu on töötamiseks saadaval

If (!extension_loaded("zip")) ( return false; )

Kui kõik on korras, jätkab skripti täitmist.

Väike offtopic selliste kontrollide jaoks. Kontrollid tuleks teha nii, vältides suuri struktuure pesastatud sulgudega. Nii on kood sisukam ja seda on lihtsam siluda. Võrdlema

If(a==b)( if(c==d)( if(e==f)( echo "Kõik tingimused on täidetud"; )else echo "e<>f"; )else echo "c<>d"; )else echo "a<>b;

ja see kood

Kui(a!=b) exit("a<>b); if(c!=d) exit("c<>d); if(e!=f) exit("e<>f); kaja "Kõik tingimused täidetud";

Kood on kenam ja ei kasva tohututeks pesastatud struktuurideks.

Vabandan teemavälise oleku pärast, aga tahtsin seda leidu jagada.

Nüüd loome objekti ja arhiivi.

$zip = uus ZipArhiiv(); if (!$zip->open($sihtkoht, ZIPARCHIVE::CREATE)) ( return false; )

kus $sihtkoht on täielik tee arhiivi. Kui arhiiv on juba loodud, lisatakse failid sinna.

$zip->addEmptyDir(str_replace($source . "/", "", $fail . "/"));

kus $source on meie kategooria täielik tee (mille algselt arhiveerisime), siis $fail on praeguse kausta täielik tee. Seda tehakse nii, et arhiiv ei sisaldaks täisteid, vaid ainult suhtelisi.

Faili lisamine toimib sarnaselt, kuid kõigepealt peate selle stringiks lugema.

$zip->addFromString(str_replace($source . "/", "", $fail), file_get_contents($file));

Lõpuks peate arhiivi sulgema.

Tagasta $zip->close();

Ma arvan, et pole vaja selgitada, kuidas kaustas kõiki faile ja alamkatalooge läbi vaadata. Googelda, midagi taolist Rekursiivne kaustade läbimine php-s

Mulle see variant sobis

Funktsioon Zip($source, $sihtkoht)( if (!extension_loaded("zip") || !file_exists($source)) ( return false; ) $zip = new ZipArchive(); if (!$zip->open() $sihtkoht, ZIPARCHIVE::LOO = new RecursiveIteratorIterator(new RecursiveDirectoryIterator($source), RecursiveIteratorIterator::SELF_FIRST foreach ($failid $failina)( $fail = str_replace("\\", "/", $fail); // Ignoreeri "." ja ".." kaustad if(in_array(substr($fail, strrpos($fail, "/")+1), array(".", ".."))) Jätkake $fail = realpath($fail ); $fail = str_replace("\\", "/", $fail , $fail . "/")); )else if (on_file($file) === true)( $zip->addFromString(str_replace($source . "/", "", $fail), file_get_contents($ fail)); ) ) )else if (on_fail($source) === true)( $zip->addFromString(basename($source), file_get_contents($source)); ) return $zip->close(); )