Mijn WP Uniparser-plug-in is een universele parser voor het automatisch aanvullen van blogs!!! Blog-parser met export naar WordPress WordPress-inhoudsparser

Soms heeft het geen zin om in je eentje tijd te besteden aan het schrijven van tekst voor een WordPress-site. Dit geval is niet van toepassing op blogs en infosites, aangezien de inkomsten daarop juist worden gevormd dankzij de geplaatste berichten.

En dan hebben we het over webwinkels, bedrijfswebsites en nieuwsportalen die niet zijn ingericht op organisch verkeer. Voor dergelijke bronnen zijn unieke materialen niet zo belangrijk als hun constante actualisering.

Als u een site voor automatisch aanvullen wilt maken, moet u een nieuwsparser voor uw project instellen. Eerst moet u geschikte sites vinden van waaruit u gaat parsen. Ze moeten overeenkomen met het thema van uw project, anders heeft het geen zin om informatie van hen te dupliceren. Als dat het geval is, moet u doorgaan naar het tweede deel van het oplossen van het parseerprobleem - zo kloont u tekst van een andere site. De meest primitieve en onhandige manier is handmatig kopiëren. Maar het is veel redelijker om een ​​van de plug-ins uit dit artikel te gebruiken om een ​​succesvolle nieuws- en inhoudsparser te activeren.

WP-O-Matic

Een zeer populaire module voor WordPress waarmee u een functionele nieuwsparser van andere sites kunt opzetten. De tool wordt op de eenvoudigste manier geïnstalleerd: hetzij door rechtstreeks naar een map op de hosting te downloaden, hetzij via het tabblad "Plug-ins".

Vervolgens moet u de plug-in configureren als u inhoudsparsing wilt bieden. Om dit te doen, klikt u vier keer op "Volgende" en aan het einde op "Verzenden". Hiermee gaat u akkoord met de gebruiksvoorwaarden van deze WordPress-module. Ga er met name mee akkoord dat alleen u verantwoordelijk bent voor de diefstal van materiaal van anderen, de inhoud van andere sites, enz.

Als u naast de tekstcomponent ook geïnteresseerd bent in afbeeldingen, moet u een map met de naam Cache maken in de map met de plug-in. Stel speciale machtigingen in voor deze map. Vervolgens moet u terugkeren naar het WordPress-beheerdersgebied. Ga naar de instellingen van de plug-in en controleer zorgvuldig of er een vinkje staat naast het Unix cron-item. U moet het selectievakje Cache Image bevestigend aanvinken, zodat de nieuwsparser ook afbeeldingen naar uw bron kopieert.

De WP-O-Matic-module is goed omdat deze op elke pagina van de site werkt. U kunt een aparte categorie toevoegen als u wilt dat de lijst met nieuws en inhoud van de parser daar wordt weergegeven. Maak hiervoor eerst de benodigde rubriek. Klik vervolgens in de WordPress-beheerder in de instellingen van de WP-O-Matic-tool op Campagne toevoegen. Vink in de regel Categorieën het vakje aan voor de speciale categorie die u hebt gemaakt. En schrijf in het formulier Feeds de RSS-feed die u gaat analyseren. U kunt meerdere URL's voor feeds tegelijk opgeven, zodat de tekstparser informatie uit drie of zelfs vier bronnen tegelijk verzamelt.

En een ander groot pluspunt in de richting van de WP-O-Matic-plug-in is de automatische publicatie van het materiaal. U hoeft niet elk uur in te loggen bij de WordPress-beheerder om de status van berichten te wijzigen in "Gepubliceerd". De module doet het zelf. En als u dat wenst, kan het de tekst uniek maken door middel van een speciaal mechanisme voor synoniemisering. Dit is het belangrijkste verschil tussen deze tool en zijn concurrent, de FeedWordPress-plug-in.

Datacol

Dit is een functionele grabber die niet alleen geschikt is voor de WordPress-engine. Dit is niet alleen een tekstparser voor webpagina's - het is een slimme applicatie waarmee u het gekopieerde materiaal kunt filteren. U kunt bijvoorbeeld alleen artikelen plaatsen die bepaalde trefwoorden hebben. U kunt nieuws rechtstreeks vanuit Yandex dupliceren. Gekloonde materialen worden geëxporteerd in een van de 15 beschikbare formaten. De dienst verzamelt niet alleen tekst, maar ook koppen, foto's, publicatiedatum, links en andere belangrijke gegevens.

Maar Datacol wordt op betaalde basis gedistribueerd. Het is echter veel goedkoper dan wanneer u via uitwisselingen materiaal op de site zou bestellen. De applicatie kost minder dan 500 roebel en kan voor bijna elke motor worden gebruikt. Er is een demoversie.

FDE Grabber

Nog een betaalde parser met veel functies. Dit komt al uit de categorie dure grijpers, aangezien het ongeveer $ 90 kost. Maar het zal mogelijk zijn om het op 10 servers tegelijk te gebruiken, dat wil zeggen dat in theorie verschillende webmasters voor $ 9 kunnen chippen, waardoor de aankoopkosten worden verlaagd.

FDE Grabber is niet bepaald een WordPress-plug-in. De ontwikkelaars noemen hun creatie een autonoom systeem dat werkt ongeacht het type CMS dat op de site is geïnstalleerd. De belangrijkste kenmerken van dit parseersysteem:

  • het downloaden van groot nieuws of losse fragmenten;
  • je kunt publicaties inplannen;
  • als u gedupliceerd materiaal uniek wilt maken, is er een ingebouwde functie voor synoniemen;
  • u kunt werken via proxyservers;
  • parsing kan omleidingen omzeilen, wat een probleem kan zijn voor andere plug-ins;
  • u kunt automatisch alle inhoud van de site downloaden en naar uw site verplaatsen (als het niet om nieuwsportalen gaat);

U kunt parsing volledig naar eigen goeddunken instellen, aangezien het programma de mogelijkheid heeft om microprogramma's te introduceren om het werk te corrigeren. Zo kunt u bijvoorbeeld de uitlijning en vormgeving van het gekopieerde materiaal aanpassen. U kunt ook de noindex- en nofollow-parameters toevoegen voor alle links die in de tekst van de pagina zullen staan. Met de parser kunt u zelfs artikelen uit buitenlandse bronnen kopiëren en automatisch vertalen. Dit is een geweldige manier om een ​​gestage stroom inhoud op uw pagina's te creëren die na verloop van tijd bezoekers zal trekken!

Parser voor WordPress is een Datacol-instelling die is ontworpen om inhoud (nieuws, artikelen, recensies, enz.) Te verzamelen met verdere export naar het WordPress CMS.

In dit voorbeeld wordt de resulterende inhoud geëxporteerd naar . De resultaten voor elk bericht worden opgeslagen in een apart bestand, waarvan de naam wordt gegenereerd op basis van de titel van het bericht en de inhoud is gebaseerd op de geparseerde informatie. U kunt ook directe export naar uw WordPress-blog instellen. Hoe je dit doet, wordt in de video getoond.

U kunt het werk van de parser voor WordPress gratis bekijken in de demoversie van het programma.
De belangrijkste voordelen van op Datacol gebaseerde parser voor WordPress zijn:

  • De mogelijkheid om parsing voor WordPress specifiek aan te passen aan uw behoeften (door u of ).
  • De mogelijkheid om de verzamelde gegevens extra te verwerken met behulp van plug-ins en deze ook te uploaden naar .
  • Mogelijkheid tot cyclische lancering van campagnes. Wanneer de resultaten van de eerste analysetaak zullen worden ingevoerd in de tweede gegevensverzamelingstaak. Lees verder.

Hoe wordt de WordPress-parser gebruikt?

Als je een blog hebt gemaakt, wordt het je na enige tijd duidelijk dat er constant nieuwe unieke inhoud nodig is om deze te promoten. En het wordt te lui om zelf artikelen te schrijven en de site handmatig te vullen. Maar waar haal je nieuwe content vandaan? Vroeg of laat komt de tijd dat je je toevlucht wilt nemen tot autobloggen. Simpel gezegd, gebruik een parser die zelf de informatie publiceert die we nodig hebben. De content-parser voor WordPress zal ons helpen om met deze taak om te gaan.

Alle sites zijn ooit helemaal opnieuw gemaakt. Maar als het doel van uw site is om informatie te verstrekken, wordt het pas interessant als de hoeveelheid informatie een bepaalde hoeveelheid overschrijdt. De WordPress-blogparser is een geweldige oplossing voor deze taak. Met zijn hulp kunt u in korte tijd de concurrentie inhalen, waardoor de catalogus met informatie op de site aanzienlijk wordt uitgebreid. De WordPress-parser kan worden geïmplementeerd als een WordPress-grabber van een specifieke site.

De WordPress Blog Parser kan bij veel taken helpen, hier zijn er een paar:
– eerste vulling van de bron (met een site-parser voor WordPress kunt u de blog in de kortst mogelijke tijd vullen met informatie vanaf het begin tot het vereiste volume);
- creatie van een automatisch ingevulde blog (de WordPress-parser zal in staat zijn om de inhoud van de site regelmatig automatisch bij te werken)
— publicatie van inhoud "op schema" (u kunt de tijd plannen om berichten aan uw site toe te voegen)

Bulkposten in WordPress

De WordPress-parser in Datacol is een goed voorbeeld van het gebruik van een bulkpost-parser. Hiermee kunt u automatisch inhoud ontvangen en deze op uw blog publiceren. Het parsingproces van WordPress kan in verschillende stappen worden verdeeld:

1) Het proces van het verzamelen van inhoud. De parser voor WordPress verzamelt de nodige informatie voor elk blogbericht: titel, inhoud (geüpload met afbeeldingen die op uw computer worden opgeslagen om verder te uploaden via FTP naar uw server), categorie, auteur en link waarvan de gegevens zijn verzameld (URL) .

2) De informatie opslaan die door de parser voor WordPress is verzameld. Na het ontleden wordt de verzamelde informatie opgeslagen in TXT-bestanden (elke post wordt opgeslagen in een afzonderlijk tekstbestand), waarvan de namen worden gegenereerd in overeenstemming met de titel van de post.

3) WordPress exporteren. Het is ook mogelijk om de geparseerde informatie direct naar uw WordPress-blog te exporteren. Dit maakt het vulproces erg snel en elimineert de mogelijkheid van menselijke fouten. De mogelijkheid om te exporteren naar WordPress wordt geleverd in de basisfunctionaliteit van het programma. U moet de instellingen voor verbinding met uw blog specificeren in de programma-instellingen en de gegevens voor export instellen (titel, inhoud, categorie, etc.)

4) Informatieverwerking. Desgewenst kan de tijdens het parsingproces van WordPress verzamelde informatie worden verwerkt (bijvoorbeeld onderworpen aan automatische vertaling of synoniemisering). Deze functies worden geïmplementeerd met behulp van plug-ins.

Hoe een site op WordPress te ontleden?

U kunt de geparseerde informatie niet alleen in WordPress publiceren, maar u kunt er ook uit ontleden. De taak om de WordPress-blogs van anderen te gebruiken als een bron van inhoud voor uw blogs komt vrij vaak voor. Om het op te lossen, zal een WordPress-site-parser u helpen. Het algoritme van de WordPress-site-parser is vergelijkbaar met het hierboven beschreven algoritme.

Voordelen van een WordPress-siteschraper

Je hebt waarschijnlijk al gezien dat de WordPress blog-parser je zal helpen om niet veel tijd en moeite te besteden aan het handmatig vullen van je blog. Hierdoor kunt u niet alleen uw werk automatiseren, maar ook de efficiëntie verhogen. U kunt de parser voor WordPress downloaden die is geïmplementeerd als onderdeel van Datacol door

De blogparser testen

De blogparser testen:

Stap 2. De campagneboom bevat de campagne content-parsers/kolchaka-net.par. Selecteer het en klik op de knop Afspelen. Voordat u begint, kunt u de invoergegevens bewerken. U kunt dus een link instellen naar de blog of blogpagina's van waaruit u inhoud gaat parseren.

Stap 3. Wacht tot de resultaten van de blogparser verschijnen. Nadat de resultaten verschijnen, kunt u het parseren geforceerd stoppen (door op de knop Stoppen te klikken).

klik op afbeelding om te vergroten

Stap 4. Na het beëindigen / geforceerd stoppen van de parser in de map Mijn documenten, kunt u tekstbestanden vinden (elk bericht wordt opgeslagen in een apart bestand), waarvan de namen worden gegenereerd op basis van de namen van de berichten:

klik op afbeelding om te vergroten

Ik presenteer u universeel WordPress Grabber WP UniParser. Deze plug-in is universele aangepaste parser. Bij het maken van berichten kan de plug-in inhoud vertalen via de Google Translate-service met behulp van elke taalcombinatie.

klanten-reviews

Het onderwerp van de zoekopdracht, waar er ongeveer 6-7 beoordelingen waren, is verwijderd door de moderators (ze zeggen dat het product niet voldoet aan de regels van het forum). Desalniettemin is er één recensie te lezen op het mulnet en armada-forum. Er zijn ook recensies van bloggers: hier en hier. Laatst kwam ik bij toeval deze review tegen.

Belangrijkste functionaliteit

De WP UniParser-plug-in die ik heb gemaakt, kan het volgende doen:
inhoud ophalen sites op alle motoren(de parser is geconfigureerd met behulp van reguliere expressies en restrictiestrings, de setup is heel eenvoudig, ik zal alles uitleggen en laten zien, daarnaast is er een );
knip scripts, opmerkingen, koppelingen, formulieren, afbeeldingen, spans, objecten, evenals alle fragmenten die u specificeert uit de inhoud.
publicatie plannen posten;
plaats geparseerde materialen in een categorie die u definieert (of verdeel ze willekeurig in categorieën);
realiseren automatische vertaling(in beide richtingen) in alle talen die worden ondersteund door Google Translate.

U kunt meer leren over de set plug-infuncties in de schermafbeelding van het admin-paneel:

Ook voor een volledig begrip van de werking van een universele grijper is het de moeite waard.

Een redelijk krachtige universele parser voor WordPress. Hiermee kunt u inhoud van een of meer bronnen verzamelen en verwerken en aanpassen aan het vereiste formaat met behulp van alle functies van de PHP-taal. Er is een mogelijkheid van vertraagde parsing. De beste gratis parser voor wordpress op dit moment - AftParser staat altijd voor je klaar!

Korte omschrijving van de functionaliteit:

De parser bestaat uit 4 pagina's: Main Page, Link Parser Page, RSS Feed Parser Page en Settings Page. Zo ziet het eruit na de installatie:

Aandacht: Je leest hoe je AftParser instelt.

Laten we beginnen met de hoofdpagina. Het toont een lijst met parsers die momenteel worden uitgevoerd.

Op elke pagina wordt in blokken uitleg gegeven. Alle documentatie wordt uit de doos geleverd, het is voldoende om aandachtig te lezen om alles duidelijk te maken.

Site-parser:

Met de site-parserpagina kunt u gegevens uit zowel één als meerdere bronnen analyseren. Het is alleen nodig om links naar materialen te geven.

Wat? Te lui om door het netwerk te graven en handmatig materialen te verzamelen? Wanhoop niet - alles is geautomatiseerd.

Er zijn twee tools waarmee u de lijst met links automatisch kunt invullen.

- een soort emulatie van een zoekmachine. De robot zal door de pagina's van de site lopen die ernaartoe zijn overgebracht en alle interne links van hen verzamelen.

Natuurlijk zal een lijst met links gevuld met automatische algoritmen zwaar bezaaid zijn met onnodige gegevens. Dit is waar filters te hulp komen.

- de eenvoudigste en snelste manier om te filteren. U vult de voorwaarden in en het filter zelf voert de verwerking uit.

Geavanceerd linkfilter- een linkfilter waarmee u hun inhoud kunt wijzigen en een heleboel andere dingen kunt doen. Alleen voor ervaren gebruikers. Ik raad je aan om php te leren voordat je daar iets gaat doen.

Als u de linkverzameling heeft voltooid, is de volgende stap het toevoegen van inhoudsranden.

Met deze grenzen bepaalt de parser de gebieden die moeten worden verwerkt.

Syntaxisaccentuering wordt geïmplementeerd met behulp van de ACE javascript-editor. Alle documentatie en alle beschikbare functies staan ​​vermeld op de plug-inpagina. De lijst is erg indrukwekkend en ik kan hem hier niet plaatsen, aangezien dit materiaal al erg lang is. Installeer gewoon de plug-in en lees verder, u zult onder de indruk zijn, dat garandeer ik u.

De pagina ziet er hetzelfde uit rss feed-parser, met het enige verschil dat er geen verplichting is om lijsten met links te verstrekken.

Er zijn nogal wat activiteitengebieden waar de parser kan worden gebruikt, maar in wezen is het het verzamelen van verschillende informatie. U kunt alleen programmatisch snel foto's en links verzamelen. Door een parser te gebruiken om naar informatie te zoeken, kunt u dit proces automatiseren, waardoor u aanzienlijk tijd bespaart. Als u een WordPress-site heeft, kunt u deze eenvoudig automatisch laten aanvullen met behulp van de AftParser-parser.

is een gratis, universele parser voor WordPress. stelt u in staat om inhoud van een of verschillende bronnen te verzamelen en deze in PHP naar het gewenste formaat te verwerken. De parser is gemaakt als plugin voor WordPress. Na de gebruikelijke installatie van de plug-in verschijnt het parsermenu in de wordpress-console, zoals op de afbeelding.

De parser heeft twee hoofdtools: de wordpress site-parser en de wordpress rss-parser.

Parser voor WordPress kan:

1. Parseert gegevens van links

Je hoeft alleen maar links naar de bron te geven. Als er geen links zijn, kunnen ze worden verzameld door de parser. Specificeer het pad naar de sitemap en de grabber verzamelt alle links. Of u kunt links verzamelen van elke html-pagina. Links kunnen worden gefilterd volgens de criteria die u nodig heeft. Er zijn twee linkfilters waarmee u de parseervoorwaarden kunt wijzigen. Ervaren gebruikers kunnen zelf parseermacro's maken, wat de parser zeer flexibel maakt voor hun behoeften.

2. Parseert RSS-feedgegevens

Alles is hier eenvoudig, voer de gewenste feed-URL in en klik op start parsing.
Een van de mogelijke toepassingen van een parser voor WordPress is om de nieuwskolommen op uw site te vullen met behulp van informatiebronnen zoals blogs, RSS-feeds, VKontakte-pagina's, enzovoort. Concurrenten - WP-O-Matic, FeedWordPress, CyberSyn.