Bicycle intitle semua penerbitan pengguna sebelumnya. Menggunakan Ciri-Ciri Google yang Kurang Diketahui untuk Mencari Perkara yang Tersembunyi

Bahasa pertanyaan ialah bahasa pengaturcaraan buatan manusia yang digunakan untuk membuat pertanyaan dalam pangkalan data dan sistem maklumat.

Secara umum, kaedah pertanyaan tersebut boleh dikelaskan bergantung kepada sama ada ia digunakan untuk pangkalan data atau untuk mendapatkan maklumat. Perbezaannya ialah permintaan kepada perkhidmatan sedemikian dibuat untuk mendapatkan jawapan fakta kepada soalan yang dikemukakan, manakala enjin carian cuba mencari dokumen yang mengandungi maklumat yang berkaitan dengan kawasan minat pengguna.

Pangkalan data

Bahasa pertanyaan pangkalan data termasuk contoh berikut:

  • QL - berorientasikan objek, merujuk kepada pengganti Datalog.
  • Kontekstual (CQL) - bahasa formal perwakilan pertanyaan untuk sistem mendapatkan maklumat (seperti indeks web atau katalog bibliografi).
  • CQLF (CODYASYL) - untuk pangkalan data CODASYL-TYPE.
  • Concept Oriented Query Language (COQL) - digunakan dalam model berkaitan (com). Ia berdasarkan prinsip pemodelan data construpt dan menggunakan operasi seperti unjuran dan penyahunjuran analisis multivariate, operasi analitik dan inferens.
  • DMX - digunakan untuk model
  • Datalog ialah bahasa pertanyaan pangkalan data deduktif.
  • Bahasa Inggeris Gellish ialah bahasa yang boleh digunakan untuk menanyakan pangkalan data Bahasa Inggeris Gellish dan membenarkan dialog (pertanyaan dan respons) dan juga berfungsi untuk pemodelan maklumat pengetahuan.
  • HTSQL - menterjemah permintaan http kepada SQL.
  • ISBL - digunakan untuk PRTV (salah satu sistem pengurusan pangkalan data hubungan pertama).
  • LDAP ialah protokol perkhidmatan pertanyaan dan direktori yang dijalankan melalui TCP/IP.
  • MDX - diperlukan untuk pangkalan data OLAP.

Enjin carian

Bahasa pertanyaan carian, seterusnya, bertujuan untuk mencari data dalam enjin carian. Ia berbeza kerana pertanyaan selalunya mengandungi teks biasa atau hiperteks dengan sintaks tambahan (seperti "dan"/"atau"). Ia berbeza dengan ketara daripada bahasa standard yang serupa, yang dikawal oleh peraturan sintaks perintah yang ketat atau mengandungi parameter kedudukan.

Bagaimanakah pertanyaan carian diklasifikasikan?

Terdapat tiga kategori umum yang merangkumi kebanyakan pertanyaan carian: maklumat, navigasi dan transaksi. Walaupun klasifikasi ini belum ditubuhkan secara teori, ia telah disahkan secara empirik dengan kehadiran pertanyaan sebenar dalam enjin carian.

Pertanyaan maklumat ialah pertanyaan yang merangkumi topik yang luas (seperti bandar atau model trak tertentu) yang boleh mengembalikan beribu-ribu hasil yang berkaitan.

Pertanyaan navigasi ialah pertanyaan yang mencari tapak atau halaman web tunggal pada topik tertentu (contohnya, YouTube).

Transaksional - mencerminkan niat pengguna untuk melakukan tindakan tertentu, contohnya, membeli kereta atau menempah tiket.

Enjin carian selalunya menyokong jenis pertanyaan keempat, yang lebih jarang digunakan. Ini adalah apa yang dipanggil permintaan sambungan, yang mengandungi laporan tentang ketersambungan graf web yang diindeks (bilangan pautan ke URL tertentu, atau berapa banyak halaman yang diindeks daripada domain tertentu).

Bagaimanakah maklumat dicari?

Menjadi dikenali ciri menarik berkaitan dengan carian web:

Purata panjang pertanyaan carian ialah 2.4 perkataan.

  • Kira-kira separuh daripada pengguna membuat satu permintaan, dan kurang daripada satu pertiga pengguna membuat tiga atau lebih permintaan unik secara bergantian.
  • Hampir separuh daripada pengguna hanya melihat satu atau dua halaman pertama hasil carian.
  • Kurang daripada 5% pengguna menggunakan keupayaan carian lanjutan (contohnya, memilih kategori tertentu atau mencari dalam carian).

Ciri tindakan tersuai

Kajian itu juga mendapati bahawa 19% pertanyaan mengandungi istilah geografi (cth. nama, poskod, objek geografi, dsb.). Ia juga perlu diperhatikan bahawa sebagai tambahan kepada pertanyaan ringkas(iaitu, dengan berbilang syarat), selalunya terdapat corak yang boleh diramal di mana pengguna menukar frasa carian mereka.

Ia juga mendapati bahawa 33% permintaan daripada pengguna yang sama diulang, dan dalam 87% kes pengguna akan mengklik pada hasil yang sama. Ini menunjukkan bahawa ramai pengguna menggunakan pertanyaan berulang untuk menyemak atau mencari semula maklumat.

Pengagihan kekerapan permintaan

Di samping itu, pakar mengesahkan bahawa taburan kekerapan pertanyaan sepadan dengan undang-undang kuasa. Itu dia bahagian kecil kata kunci diperhatikan dalam senarai pertanyaan terbesar (mis. lebih 100 juta) dan ia adalah yang paling kerap digunakan. Frasa selebihnya dalam topik yang sama digunakan kurang kerap dan lebih individu. Fenomena ini dipanggil prinsip Pareto (atau "peraturan 80-20"), dan ia telah membenarkan enjin carian menggunakan teknik pengoptimuman seperti pengindeksan atau pembahagian pangkalan data, caching dan pramuat, dan juga telah memungkinkan untuk meningkatkan enjin carian. bahasa pertanyaan.

DALAM tahun lepas Telah didapati bahawa purata panjang pertanyaan telah meningkat secara berterusan dari semasa ke semasa. Oleh itu, pertanyaan purata dalam bahasa Inggeris telah menjadi lebih panjang. Untuk tujuan ini, Google memperkenalkan kemas kini yang dipanggil "Hummingbird" (pada Ogos 2013), yang mampu memproses frasa carian panjang dengan bahasa pertanyaan bukan protokol, "kolokial" (seperti "di mana kedai kopi terdekat?").

Untuk lebih pertanyaan panjang pemprosesan mereka digunakan - mereka dibahagikan kepada frasa yang dirumuskan bahasa standard, dan jawapan kepada bahagian yang berbeza dipaparkan secara berasingan.

Pertanyaan berstruktur

Enjin carian yang menyokong kedua-dua sintaks menggunakan bahasa pertanyaan yang lebih maju. Pengguna yang mencari dokumen yang merangkumi pelbagai topik atau aspek boleh menerangkan setiap satu daripada mereka dengan ciri logik perkataan tersebut. Pada terasnya, bahasa pertanyaan logik ialah himpunan frasa dan tanda baca tertentu.

Apakah carian lanjutan?

Bahasa pertanyaan Yandex dan Google mampu melakukan carian yang lebih fokus jika syarat tertentu dipenuhi. Carian lanjutan boleh mencari mengikut sebahagian daripada tajuk halaman atau awalan tajuk, serta kategori tertentu dan senarai nama. Ia juga boleh mengehadkan carian kepada halaman yang mengandungi perkataan tertentu dalam tajuk atau berada dalam kumpulan topik tertentu. Pada penggunaan yang betul bahasa pertanyaan, ia boleh memproses parameter yang merupakan susunan magnitud yang lebih kompleks daripada hasil cetek kebanyakan enjin carian, termasuk perkataan yang ditentukan pengguna dengan pengakhiran berubah-ubah dan ejaan yang serupa. Apabila anda membentangkan hasil carian lanjutan, pautan ke bahagian halaman yang berkaitan akan dipaparkan.

Ia juga mungkin untuk mencari semua halaman yang mengandungi frasa tertentu, manakala dengan pertanyaan standard, enjin carian tidak boleh berhenti di mana-mana halaman perbincangan. Dalam kebanyakan kes, bahasa pertanyaan boleh membawa kepada mana-mana halaman yang terletak dalam teg noindex.

Dalam sesetengah kes, pertanyaan yang dibentuk dengan betul membolehkan anda mencari maklumat yang mengandungi beberapa aksara khas dan huruf abjad lain ( aksara Cina Sebagai contoh).

Bagaimanakah aksara bahasa pertanyaan dibaca?

Atas dan huruf kecil, serta beberapa (umlaut dan aksen) tidak diambil kira dalam carian. Sebagai contoh, carian untuk kata kunci Citroen tidak akan menemui halaman yang mengandungi perkataan "Citroen". Tetapi beberapa ligatur sepadan dengan huruf individu. Sebagai contoh, carian untuk "aeroskobing" akan mencari halaman yang mengandungi "Ereskobing" (AE = Æ) dengan mudah.

Banyak aksara bukan abjad angka sentiasa diabaikan. Sebagai contoh, adalah mustahil untuk mencari maklumat untuk pertanyaan yang mengandungi rentetan |L| (huruf antara dua bar menegak), walaupun aksara ini digunakan dalam beberapa corak penukaran. Hasilnya hanya akan mengandungi data daripada "LT". Sesetengah aksara dan frasa dilayan secara berbeza: pertanyaan untuk "kredit (Kewangan)" akan memaparkan entri dengan perkataan "kredit" dan "kewangan", mengabaikan kurungan, walaupun terdapat entri dengan nama tepat "kredit (Kewangan) ".

Terdapat banyak fungsi yang boleh digunakan menggunakan bahasa pertanyaan.

Sintaks

Bahasa pertanyaan Yandex dan Google mungkin menggunakan beberapa tanda baca untuk memperhalusi carian. Contohnya ialah pendakap gigi- ((cari)). Frasa yang terkandung di dalamnya akan dicari secara keseluruhannya, tanpa perubahan.

Frasa dalam membolehkan anda menentukan objek carian. Sebagai contoh, perkataan dalam tanda petikan akan diiktiraf sebagai digunakan dalam erti kata kiasan atau sebagai watak fiksyen, tanpa tanda petikan - sebagai maklumat yang lebih bersifat dokumentari.

Selain itu, semua enjin carian utama menyokong simbol "-" untuk logik "tidak" dan juga dan/atau. Pengecualian ialah istilah yang tidak boleh diawali dengan tanda sempang atau sempang.

Padanan frasa carian yang tidak tepat ditandakan dengan ~. Sebagai contoh, jika anda tidak ingat perkataan yang tepat bagi istilah atau tajuk, anda boleh memasukkannya dalam bar carian dengan simbol yang ditentukan, dan anda boleh mendapatkan hasil yang serupa yang mungkin.

Pilihan Carian Tersuai

Terdapat juga parameter carian seperti intitle dan incategory. Ia adalah penapis yang dipaparkan dipisahkan oleh titik bertindih, dalam bentuk "penapis: rentetan pertanyaan". Rentetan pertanyaan boleh mengandungi istilah atau frasa yang anda cari, atau sebahagian atau keseluruhan tajuk halaman.

Ciri "intitle: query" memberi keutamaan dalam hasil carian berdasarkan tajuk, tetapi juga menunjukkan hasil organik berdasarkan kandungan tajuk. Beberapa penapis ini boleh digunakan serentak. Bagaimana untuk menggunakan peluang ini?

Pertanyaan seperti "intitle: nama lapangan terbang" akan mengembalikan semua artikel yang mengandungi nama lapangan terbang dalam tajuk. Jika anda merumuskannya sebagai "tajuk letak kereta: nama lapangan terbang," maka anda akan mendapat artikel dengan nama lapangan terbang dalam tajuk dan menyebut tempat letak kereta dalam teks.

Carian menggunakan penapis "incategory: Category" berfungsi berdasarkan prinsip pada mulanya memaparkan artikel kepunyaan kumpulan tertentu atau senarai halaman. Contohnya, pertanyaan carian seperti "Inkategori kuil: Sejarah" akan mengembalikan hasil pada topik sejarah kuil. Fungsi ini juga boleh digunakan sebagai fungsi lanjutan dengan menentukan pelbagai parameter.

Mendapatkan data peribadi tidak selalu bermakna penggodaman - kadangkala ia diterbitkan secara terbuka. Pengetahuan tetapan Google dan sedikit kepintaran akan membolehkan anda mencari banyak perkara menarik - daripada nombor kad kredit hingga dokumen FBI.

AMARAN

Semua maklumat disediakan untuk tujuan maklumat sahaja. Baik editor mahupun pengarang tidak bertanggungjawab untuk apa-apa kemungkinan bahaya disebabkan oleh bahan-bahan artikel ini.

Hari ini, semuanya disambungkan ke Internet, dengan sedikit kebimbangan untuk menyekat akses. Oleh itu, banyak data peribadi menjadi mangsa enjin carian. Robot labah-labah tidak lagi terhad kepada halaman web, tetapi mengindeks semua kandungan yang tersedia di Internet dan sentiasa menambah maklumat bukan awam ke pangkalan data mereka. Mengetahui rahsia ini adalah mudah - anda hanya perlu tahu cara bertanya tentangnya.

Mencari fail

Di tangan yang berkebolehan, Google akan mencari dengan cepat semua yang tidak ditemui di Internet, contohnya, maklumat peribadi dan fail untuk kegunaan rasmi. Mereka sering disembunyikan seperti kunci di bawah permaidani: tiada sekatan akses sebenar, data hanya terletak di bahagian belakang tapak, di mana tiada pautan memimpin. Antara muka web Google standard hanya menyediakan tetapan carian lanjutan asas, tetapi ini pun sudah memadai.

Hadkan carian kepada fail jenis tertentu dalam Google anda boleh menggunakan dua operator: jenis fail dan samb . Yang pertama menentukan format yang ditentukan oleh enjin carian daripada tajuk fail, yang kedua menentukan sambungan fail, tanpa mengira kandungan dalamannya. Apabila mencari dalam kedua-dua kes, anda hanya perlu menentukan sambungan. Pada mulanya, operator ext mudah digunakan dalam kes di mana fail tidak mempunyai ciri format tertentu (contohnya, untuk mencari konfigurasi fail ini dan cfg, di dalamnya boleh ada apa-apa). Sekarang Algoritma Google telah berubah, dan tiada perbezaan yang kelihatan antara pengendali - keputusan dalam kebanyakan kes adalah sama.


Menapis keputusan

Secara lalai, Google mencari perkataan dan, secara umum, sebarang aksara yang dimasukkan dalam semua fail pada halaman yang diindeks. Anda boleh mengehadkan carian anda mengikut domain tingkat atas, tapak tertentu atau di lokasi urutan yang dikehendaki dalam fail itu sendiri. Untuk dua pilihan pertama, gunakan operator tapak, diikuti dengan nama domain atau tapak yang dipilih. Dalam kes ketiga, satu set keseluruhan operator membolehkan anda mencari maklumat dalam medan perkhidmatan dan metadata. Sebagai contoh, allinurl akan mencari yang diberikan dalam badan pautan itu sendiri, allinanchor - dalam teks yang dilengkapi dengan tag , allintitle - dalam tajuk halaman, allintext - dalam badan halaman.

Untuk setiap pengendali terdapat versi ringan dengan nama yang lebih pendek (tanpa awalan semua). Perbezaannya ialah allinurl akan mencari pautan dengan semua perkataan, dan inurl hanya akan mencari pautan dengan yang pertama daripadanya. Perkataan kedua dan seterusnya daripada pertanyaan boleh muncul di mana-mana di halaman web. Operator inurl juga berbeza daripada operator lain dengan maksud yang sama - tapak. Yang pertama juga membolehkan anda mencari sebarang jujukan aksara dalam pautan ke dokumen yang dicari (contohnya, /cgi-bin/), yang digunakan secara meluas untuk mencari komponen yang mempunyai kelemahan yang diketahui.

Mari cuba dalam amalan. Kami mengambil penapis allintext dan membuat permintaan menghasilkan senarai nombor dan kod pengesahan kad kredit yang akan tamat tempoh hanya dalam masa dua tahun (atau apabila pemiliknya bosan memberi makan kepada semua orang).

Allintext: tarikh luput nombor kad /2017 cvv

Apabila anda membaca dalam berita bahawa seorang penggodam muda "menggodam ke dalam pelayan" Pentagon atau NASA, mencuri maklumat sulit, dalam kebanyakan kes kita bercakap tentang teknik asas menggunakan Google. Katakan kami berminat dengan senarai pekerja NASA dan maklumat hubungan mereka. Pastinya senarai sedemikian tersedia dalam bentuk elektronik. Untuk kemudahan atau disebabkan oleh pengawasan, ia juga mungkin berada di tapak web organisasi itu sendiri. Adalah logik bahawa dalam kes ini tidak akan ada pautan kepadanya, kerana ia bertujuan untuk kegunaan dalaman. Apakah perkataan yang boleh terdapat dalam fail sedemikian? Sekurang-kurangnya - medan "alamat". Menguji semua andaian ini adalah mudah.


Inurl:nasa.gov filetype:xlsx "alamat"


Kita guna birokrasi

Penemuan seperti ini adalah sentuhan yang bagus. Tangkapan yang benar-benar kukuh disediakan oleh pengetahuan yang lebih terperinci tentang pengendali Google untuk juruweb, Rangkaian itu sendiri, dan keanehan struktur perkara yang dicari. Mengetahui butirannya, anda boleh menapis hasil dengan mudah dan memperhalusi sifat fail yang diperlukan untuk mendapatkan data yang benar-benar berharga dalam selebihnya. Sungguh melucukan bahawa birokrasi datang untuk menyelamatkan di sini. Ia menghasilkan formulasi standard yang mudah untuk mencari maklumat rahsia yang secara tidak sengaja bocor ke Internet.

Contohnya, setem penyata Pengedaran, yang diperlukan oleh Jabatan Pertahanan AS, bermaksud sekatan piawai ke atas pengedaran dokumen. Huruf A menandakan siaran awam yang tidak ada rahsia; B - bertujuan hanya untuk kegunaan dalaman, C - sulit, dan seterusnya sehingga F. Huruf X menonjol secara berasingan, yang menandakan maklumat berharga yang mewakili rahsia negara peringkat tertinggi. Biarkan mereka yang sepatutnya melakukan tugas ini mencari dokumen sedemikian, dan kami akan mengehadkan diri kami kepada fail dengan huruf C. Menurut arahan DoDI 5230.24, penandaan ini diberikan kepada dokumen yang mengandungi penerangan tentang teknologi kritikal yang berada di bawah kawalan eksport . Anda boleh mendapatkan maklumat yang dilindungi dengan teliti di tapak dalam domain.mil peringkat atas, yang diperuntukkan untuk Tentera AS.

"KENYATAAN AGIHAN C" inurl:navy.mil

Adalah sangat mudah bahawa domain .mil hanya mengandungi tapak daripada Jabatan Pertahanan AS dan organisasi kontraknya. Hasil carian dengan sekatan domain adalah sangat bersih, dan tajuk bercakap untuk diri mereka sendiri. Mencari rahsia Rusia dengan cara ini boleh dikatakan tidak berguna: huru-hara berlaku di domains.ru dan.rf, dan nama-nama banyak sistem senjata terdengar seperti nama botani (PP "Kiparis", senjata bergerak sendiri "Akatsia") atau bahkan hebat ( TOS "Buratino").


Dengan mengkaji dengan teliti mana-mana dokumen daripada tapak dalam domain .mil, anda boleh melihat penanda lain untuk memperhalusi carian anda. Sebagai contoh, rujukan kepada sekatan eksport "Sec 2751", yang juga mudah untuk mencari maklumat teknikal yang menarik. Dari semasa ke semasa ia dialih keluar daripada tapak rasmi di mana ia pernah muncul, jadi jika anda tidak dapat mengikuti pautan menarik dalam hasil carian, gunakan cache Google (pengendali cache) atau tapak Arkib Internet.

Memanjat ke awan

Sebagai tambahan kepada dokumen kerajaan yang didedahkan secara tidak sengaja, pautan ke fail peribadi daripada Dropbox dan perkhidmatan storan data lain yang mencipta pautan "peribadi" kepada data yang diterbitkan secara umum kadangkala muncul dalam cache Google. Lebih teruk lagi dengan perkhidmatan alternatif dan buatan sendiri. Sebagai contoh, pertanyaan berikut mencari data untuk semua pelanggan Verizon yang telah memasang pelayan FTP dan secara aktif menggunakan penghala mereka.

Allinurl:ftp:// verizon.net

Kini terdapat lebih daripada empat puluh ribu orang pintar seperti itu, dan pada musim bunga 2015 terdapat lebih ramai lagi daripada mereka. Daripada Verizon.net, anda boleh menggantikan nama mana-mana pembekal yang terkenal, dan lebih terkenal ia, lebih besar hasil tangkapan. Melalui pelayan FTP terbina dalam, anda boleh melihat fail pada peranti storan luaran yang disambungkan ke penghala. Biasanya ini ialah NAS untuk kerja jauh, awan peribadi atau sejenis muat turun fail rakan ke rakan. Semua kandungan media tersebut diindeks oleh Google dan enjin carian lain, jadi anda boleh mengakses fail yang disimpan pada pemacu luaran melalui pautan terus.

Melihat pada konfigurasi

Sebelum pemindahan meluas ke awan, pelayan FTP mudah memerintah sebagai storan jauh, yang juga mempunyai banyak kelemahan. Ramai daripada mereka masih relevan hari ini. Sebagai contoh, program WS_FTP Professional yang popular menyimpan data konfigurasi, akaun pengguna dan kata laluan dalam fail ws_ftp.ini. Ia mudah dicari dan dibaca, kerana semua rekod disimpan dalam format teks, dan kata laluan disulitkan dengan algoritma Triple DES selepas kekeliruan yang minimum. Dalam kebanyakan versi, cukup membuang bait pertama sahaja.

Mudah untuk menyahsulit kata laluan tersebut menggunakan utiliti Penyahsulit Kata Laluan WS_FTP atau perkhidmatan web percuma.

Bercakap tentang menggodam tapak web sewenang-wenangnya, mereka biasanya bermaksud mendapatkan kata laluan daripada log dan sandaran fail konfigurasi CMS atau aplikasi untuk e-dagang. Jika anda mengetahui struktur tipikalnya, anda boleh menunjukkan kata kunci dengan mudah. Baris seperti yang terdapat dalam ws_ftp.ini adalah sangat biasa. Contohnya, dalam Drupal dan PrestaShop sentiasa terdapat pengecam pengguna (UID) dan kata laluan yang sepadan (pwd), dan semua maklumat disimpan dalam fail dengan sambungan .inc. Anda boleh mencarinya seperti berikut:

"pwd=" "UID=" ext:inc

Mendedahkan kata laluan DBMS

Dalam fail konfigurasi pelayan SQL, nama dan alamat E-mel pengguna disimpan dalam borang terbuka, dan bukannya kata laluan cincang MD5 mereka ditulis. Tegasnya, adalah mustahil untuk menyahsulitnya, tetapi anda boleh mencari padanan antara pasangan kata laluan cincang yang diketahui.

Masih terdapat DBMS yang tidak menggunakan pencincangan kata laluan. Fail konfigurasi mana-mana daripadanya hanya boleh dilihat dalam penyemak imbas.

Intext:DB_PASSWORD filetype:env

Dengan penampilan di pelayan tempat tingkap fail konfigurasi telah diambil alih sebahagiannya oleh pendaftaran. Anda boleh mencari melalui cawangannya dengan cara yang sama, menggunakan reg sebagai jenis fail. Sebagai contoh, seperti ini:

Jenis fail:reg HKEY_CURRENT_USER "Kata Laluan"=

Jangan kita lupa yang jelas

Kadangkala adalah mungkin untuk mendapatkan maklumat terperingkat menggunakan data yang dibuka secara tidak sengaja dan mendapat perhatian Google. Pilihan yang ideal ialah mencari senarai kata laluan dalam beberapa format biasa. Simpan maklumat akaun dalam fail teks, Dokumen perkataan atau elektronik Hamparan Excel Hanya orang yang terdesak boleh, tetapi sentiasa ada cukup daripada mereka.

Jenis fail:xls inurl:kata laluan

Di satu pihak, terdapat banyak cara untuk mengelakkan kejadian sedemikian. Adalah perlu untuk menentukan hak akses yang mencukupi dalam htaccess, menampal CMS, tidak menggunakan skrip kidal dan menutup lubang lain. Terdapat juga fail dengan senarai pengecualian robots.txt yang melarang enjin carian mengindeks fail dan direktori yang dinyatakan di dalamnya. Sebaliknya, jika struktur robots.txt pada sesetengah pelayan berbeza daripada yang standard, maka ia serta-merta menjadi jelas apa yang mereka cuba sembunyikan padanya.

Senarai direktori dan fail di mana-mana tapak didahului oleh indeks standard bagi. Oleh kerana untuk tujuan perkhidmatan ia mesti muncul dalam tajuk, masuk akal untuk mengehadkan cariannya kepada pengendali hak milik. Perkara yang menarik ada dalam direktori /admin/, /personal/, /etc/ dan juga /secret/.

Nantikan kemas kini

Perkaitan sangat penting di sini: kelemahan lama ditutup dengan perlahan, tetapi Google dan hasil cariannya sentiasa berubah. Malah terdapat perbezaan antara penapis "saat terakhir" (&tbs=qdr:s pada penghujung URL permintaan) dan penapis "masa nyata" (&tbs=qdr:1).

Selang masa tarikh kemas kini terakhir fail juga ditunjukkan secara tersirat oleh Google. Melalui antara muka web grafik, anda boleh memilih salah satu tempoh standard (jam, hari, minggu, dll.) atau menetapkan julat tarikh, tetapi kaedah ini tidak sesuai untuk automasi.

Dengan penampilan bar alamat Kita hanya boleh meneka tentang cara untuk mengehadkan output hasil menggunakan pembinaan &tbs=qdr:. Huruf y selepas ia menetapkan had satu tahun (&tbs=qdr:y), m menunjukkan keputusan untuk bulan lepas, w - untuk minggu, d - untuk hari lalu, h - untuk jam terakhir, n - seminit, dan s - sesaat. Hasil terbaharu yang baru diumumkan oleh Google didapati menggunakan penapis &tbs=qdr:1 .

Jika anda perlu menulis skrip yang bijak, adalah berguna untuk mengetahui bahawa julat tarikh ditetapkan dalam Google dalam format Julian menggunakan pengendali julat tarikh. Sebagai contoh, ini adalah cara anda boleh mencari senarai dokumen PDF dengan perkataan sulit, dimuat turun dari 1 Januari hingga 1 Julai 2015.

Jenis fail sulit:pdf julat tarikh:2457024-2457205

Julat ditunjukkan dalam format tarikh Julian tanpa mengambil kira bahagian pecahan. Menerjemahkannya secara manual daripada kalendar Gregorian adalah menyusahkan. Lebih mudah untuk menggunakan penukar tarikh.

Menyasarkan dan menapis semula

Selain menentukan pengendali tambahan dalam pertanyaan carian, mereka boleh dihantar terus dalam badan pautan. Sebagai contoh, spesifikasi filetype:pdf sepadan dengan pembinaan as_filetype=pdf . Ini memudahkan untuk bertanya sebarang penjelasan. Katakan bahawa output hasil hanya dari Republik Honduras ditentukan dengan menambahkan pembinaan cr=countryHN pada URL carian dan hanya dari bandar Bobruisk - gcs=Bobruisk. Anda boleh mencari senarai lengkap di bahagian pembangun.

Alat automasi Google direka untuk menjadikan hidup lebih mudah, tetapi ia sering menambah masalah. Sebagai contoh, IP pengguna digunakan untuk menentukan bandar mereka melalui WHOIS. Berdasarkan maklumat ini, Google bukan sahaja mengimbangi beban antara pelayan, tetapi juga mengubah hasil carian. Bergantung pada wilayah, untuk permintaan yang sama, hasil yang berbeza akan muncul pada halaman pertama, dan sebahagian daripadanya mungkin disembunyikan sepenuhnya. Kod dua huruf selepas arahan gl=country akan membantu anda berasa seperti kosmopolitan dan mencari maklumat dari mana-mana negara. Sebagai contoh, kod Belanda ialah NL, tetapi Vatican dan Korea Utara tidak mempunyai kod mereka sendiri dalam Google.

Selalunya, hasil carian berakhir berselerak walaupun selepas menggunakan beberapa penapis lanjutan. Dalam kes ini, mudah untuk menjelaskan permintaan dengan menambahkan beberapa perkataan pengecualian padanya (tanda tolak diletakkan di hadapan setiap satu daripadanya). Sebagai contoh, perbankan, nama dan tutorial sering digunakan dengan perkataan Peribadi. Oleh itu, hasil carian yang lebih bersih akan ditunjukkan bukan oleh contoh buku teks pertanyaan, tetapi oleh yang diperhalusi:

Tajuk:"Indeks /Peribadi/" -nama -tutorial -perbankan

Satu contoh terakhir

Seorang penggodam yang canggih dibezakan oleh fakta bahawa dia menyediakan dirinya dengan semua yang dia perlukan sendiri. Sebagai contoh, VPN adalah perkara yang mudah, tetapi sama ada mahal, atau sementara dan dengan sekatan. Terlalu mahal untuk melanggan untuk diri sendiri sahaja. Adalah baik bahawa terdapat langganan kumpulan, dan dengan bantuan Google adalah mudah untuk menjadi sebahagian daripada kumpulan. Untuk melakukan ini, cari sahaja fail konfigurasi VPN Cisco, yang mempunyai sambungan PCF yang agak tidak standard dan laluan yang boleh dikenali: Program Files\Cisco Systems\VPN Client\Profiles. Satu permintaan dan anda menyertai, sebagai contoh, pasukan mesra Universiti Bonn.

Jenis fail:pcf vpn ATAU Kumpulan

INFO

Google menemui fail konfigurasi kata laluan, tetapi kebanyakannya disulitkan atau digantikan dengan cincang. Jika anda melihat rentetan dengan panjang tetap, segera cari perkhidmatan penyahsulitan.

Kata laluan disimpan disulitkan, tetapi Maurice Massard telah pun menulis program untuk menyahsulitnya dan memberikannya secara percuma melalui thecampusgeeks.com.

Pada Bantuan Google ratusan telah dilaksanakan jenis yang berbeza serangan dan ujian penembusan. Terdapat banyak pilihan yang mempengaruhi program popular, format pangkalan data asas, banyak Kelemahan PHP, awan dan sebagainya. Mengetahui dengan tepat apa yang anda cari akan menjadikannya lebih mudah untuk mencari maklumat yang anda perlukan (terutamanya maklumat yang anda tidak ingin umumkan). Shodan bukan satu-satunya yang memberi makan idea yang menarik, tetapi mana-mana pangkalan data sumber rangkaian yang diindeks!

Pasti anda pernah mendengar lebih daripada sekali tentang enjin carian yang begitu hebat seperti Google. Saya rasa anda telah menggunakannya lebih daripada sekali apabila anda ingin mengetahui sesuatu. Tetapi adakah anda menemui apa yang anda mahukan? Jika anda mencari jawapan di Google sekerap yang saya lakukan, saya fikir anda akan mendapati artikel ini berguna kerana ia direka untuk menjadikan carian anda lebih pantas dan cekap. Jadi, pertama, sedikit sejarah...

Google ialah rasuah perkataan Inggeris "googol", yang dicipta oleh Milton Sirotta, anak saudara kepada ahli matematik Amerika Edward Kaiser, untuk menandakan nombor yang terdiri daripada satu dan seratus sifar. Kini nama Google ialah peneraju enjin carian Internet, yang dibangunkan oleh Google Inc.

Google menduduki lebih daripada 70% pasaran global, yang bermaksud tujuh daripada sepuluh orang dalam talian beralih ke halamannya apabila mencari maklumat di Internet. Ia kini mendaftarkan kira-kira 50 juta pertanyaan carian setiap hari dan mengindeks lebih daripada 8 bilion halaman web. Google boleh mencari maklumat dalam 101 bahasa. Google pada akhir Ogos 2004 terdiri daripada 132 ribu mesin yang terletak di bahagian yang berlainan di planet ini.

Google menggunakan teknik analisis teks pintar untuk mencari halaman penting lagi relevan untuk pertanyaan anda. Untuk melakukan ini, Google menganalisis bukan sahaja halaman itu sendiri yang sepadan dengan pertanyaan, tetapi juga halaman yang memautkannya untuk menentukan nilai halaman tersebut untuk tujuan pertanyaan anda. Google juga lebih suka halaman yang kata kunci yang anda masukkan berdekatan antara satu sama lain.

Antara muka Google mengandungi cukup banyak Bahasa yang sukar pertanyaan, membolehkan anda mengehadkan skop carian kepada domain tertentu, bahasa, jenis fail, dsb. Penggunaan sesetengah pengendali bahasa ini membolehkan anda membuat proses mencari maklumat yang diperlukan lebih fleksibel dan tepat. Mari lihat sebahagian daripada mereka.

Logik "DAN":
Secara lalai, apabila anda menulis perkataan pertanyaan yang dipisahkan oleh ruang, Google mencari dokumen yang mengandungi semua perkataan pertanyaan. Ini sepadan dengan operator AND. Itu. ruang adalah bersamaan dengan operator AND.

Sebagai contoh:
Kucing anjing burung kakak belang
Kucing DAN anjing DAN burung kakak tua DAN zebra
(kedua-dua pertanyaan adalah sama)

Logik "ATAU" (ATAU):
Ditulis menggunakan operator OR. Sila ambil perhatian bahawa pengendali ATAU mesti ditulis dengan huruf besar. Baru-baru ini, ia menjadi mungkin untuk menulis "ATAU" logik dalam bentuk bar menegak (|), sama seperti cara ia dilakukan dalam Yandex. Digunakan untuk mencari dengan beberapa pilihan untuk maklumat yang diperlukan.

Sebagai contoh:
Dachshunds berambut panjang ATAU berambut licin
Dachshunds berambut panjang | berambut licin
(kedua-dua pertanyaan adalah sama)

Sila ingat bahawa pertanyaan Google tidak sensitif huruf besar-besaran! Itu. pertanyaan Pulau Greenland dan Pulau Greenland akan sama.

Operator "Plus" (+):
Terdapat situasi apabila perlu untuk memaksa perkataan ke dalam teks yang mungkin mempunyai ejaan yang berbeza. Untuk melakukan ini, gunakan operator "+" sebelum perkataan yang diperlukan. Katakan jika kita mempunyai pertanyaan untuk Home Alone I, hasil daripada pertanyaan itu kita akan mempunyai maklumat yang tidak perlu tentang "Home Alone II", "Home Alone III" dan sangat sedikit tentang "Home Alone I". Jika kami mempunyai pertanyaan tentang borang Home Alone +I, hasilnya hanya akan mengandungi maklumat tentang filem "Home Alone I".

Sebagai contoh:
Akhbar + Zarya
Persamaan Bernoulli + matematik

Mengecualikan perkataan daripada pertanyaan. Logik BUKAN (-):
Seperti yang anda tahu, sampah maklumat sering ditemui semasa mengarang permintaan. Untuk mengalih keluarnya, pengendali pengecualian digunakan sebagai standard - logik "TIDAK". Di Google, pengendali ini diwakili oleh tanda tolak. Menggunakan operator ini, anda boleh mengecualikan daripada hasil carian halaman yang mengandungi perkataan tertentu dalam teks. Digunakan seperti operator "+" sebelum perkataan yang dikecualikan.

Sebagai contoh:
Burung telaga kren
Jiwa Mati - novel

Cari frasa yang tepat (""):
Dalam amalan, mencari frasa yang tepat diperlukan sama ada untuk mencari teks karya tertentu atau untuk mencari produk atau syarikat tertentu yang mana nama atau sebahagian daripada perihalan adalah frasa yang berulang secara konsisten. Untuk mengatasi tugas ini menggunakan Google, anda perlu menyertakan pertanyaan dalam tanda petikan (maksudnya petikan berganda, yang digunakan, sebagai contoh, untuk menyerlahkan ucapan langsung).

Sebagai contoh:
Karya "Quiet Don"
"Ia sejuk di luar, walaupun ini tidak menghalang Boris daripada melaksanakan rancangannya"

By the way, Google membenarkan anda memasukkan tidak lebih daripada 32 perkataan ke dalam bar pertanyaan!

Pemangkasan perkataan (*):
Kadangkala anda perlu mencari maklumat tentang gabungan perkataan yang mana satu atau lebih perkataan tidak diketahui. Untuk tujuan ini, bukannya perkataan yang tidak diketahui, pengendali “*” digunakan. Itu. "*" - sebarang perkataan atau kumpulan perkataan.

Sebagai contoh:
Guru dan *
Leonardo * Vinci

pengendali cache:
Enjin carian menyimpan versi teks yang diindeks oleh labah-labah carian dalam format storan khas yang dipanggil cache. Versi cache halaman boleh diambil semula jika halaman asal tidak tersedia (contohnya, pelayan tempat ia disimpan tidak berfungsi). Halaman cache ditunjukkan kerana ia disimpan dalam pangkalan data enjin carian dan disertakan dengan notis di bahagian atas halaman yang menyatakan bahawa ini adalah halaman cache. Ia juga mengandungi maklumat tentang masa versi cache dicipta. Pada halaman daripada cache, kata kunci pertanyaan diserlahkan dan setiap perkataan diserlahkan dalam warna yang berbeza untuk kemudahan pengguna. Anda boleh membuat permintaan yang akan segera mengembalikan versi cache halaman dengan alamat tertentu: cache: page_address, di mana bukannya "page_address" ialah alamat halaman yang disimpan dalam cache. Jika anda perlu mencari sebarang maklumat dalam halaman cache, anda perlu menulis permintaan untuk maklumat ini dipisahkan oleh ruang selepas alamat halaman.

Sebagai contoh:
cache:www.bsd.com
cache:www.knights.ru kejohanan

Kita mesti ingat bahawa tidak sepatutnya ada ruang antara ":" dan alamat halaman!

Pengendali jenis fail:
Seperti yang anda ketahui, Google mengindeks bukan sahaja halaman html. Jika, sebagai contoh, anda perlu mencari beberapa maklumat di tempat selain daripada jenis html fail, anda boleh menggunakan operator jenis fail, yang membolehkan anda mencari maklumat dalam jenis tertentu fail (html, pdf, doc, rtf...).

Sebagai contoh:
Spesifikasi html filetype:pdf
Esei jenis fail:rtf

Maklumat operator:
Pengendali maklumat membolehkan anda melihat maklumat yang Google ketahui tentang halaman ini.

Sebagai contoh:
maklumat:www.wiches.ru
maklumat:www.food.healthy.com

pengendali tapak:
Pengendali ini mengehadkan carian kepada domain atau tapak tertentu. Iaitu, jika anda membuat permintaan: tapak perisikan pemasaran:www.acfor-tc.ru, maka hasilnya akan diperoleh daripada halaman yang mengandungi perkataan "pemasaran" dan "kepintaran" di tapak "acfor-tc.ru" dan bukan pada bahagian lain Internet.

Sebagai contoh:
Tapak muzik:www.music.su
Tapak buku:ru

Operator pautan:
Operator ini membenarkan anda melihat semua halaman yang memaut ke halaman yang permintaannya dibuat. Oleh itu, pautan permintaan:www.google.com akan mengembalikan halaman yang mengandungi pautan ke google.com.

Sebagai contoh:
pautan: www.ozone.com
Pautan rakan:www.happylife.ru

pengendali allintitle:
Jika anda memulakan pertanyaan dengan pengendali allintitle, yang diterjemahkan sebagai "semuanya ada dalam tajuk", maka Google akan mengembalikan teks di mana semua perkataan pertanyaan terkandung dalam tajuk (di dalam teg TITLE dalam HTML).

Sebagai contoh:
allintitle: Perisian percuma
allintitle: Muat turun album muzik

pengendali intitle:
Menunjukkan halaman di mana hanya perkataan sejurus selepas pengendali tajuk terkandung dalam tajuk, dan semua perkataan pertanyaan lain boleh berada di mana-mana dalam teks. Meletakkan operator intitle sebelum setiap perkataan pertanyaan adalah sama dengan menggunakan operator allintitle.

Sebagai contoh:
Tajuk program: Muat turun
intitle: Intitle percuma: muat turun perisian

pengendali allinurl:
Jika pertanyaan bermula dengan pengendali allinurl, maka carian adalah terhad kepada dokumen-dokumen di mana semua perkataan pertanyaan terkandung hanya dalam alamat halaman, iaitu, dalam url.

Sebagai contoh:
allinurl:permainan rus
allinurl:buku fantasi

pengendali inurl:
Perkataan yang terletak secara langsung bersama-sama dengan operator inurl akan ditemui hanya dalam alamat halaman Internet, dan perkataan yang selebihnya akan ditemui di mana-mana dalam halaman sedemikian.

Sebagai contoh:
inurl:buku muat turun
inurl:permainan retak

berkaitan operator:
Operator ini menerangkan halaman yang "serupa" dengan beberapa halaman tertentu. Oleh itu, pertanyaan berkaitan:www.google.com akan mengembalikan halaman dengan topik yang serupa kepada Google.

Sebagai contoh:
berkaitan:www.ozone.com
berkaitan:www.nnm.ru

Pernyataan takrif:
Operator ini bertindak sebagai sejenis kamus penerangan, yang membolehkan anda dengan cepat mendapatkan definisi perkataan yang dimasukkan selepas operator.

Sebagai contoh:
takrifkan: Kanggaru
takrifkan: Papan induk

Operator carian sinonim (~):
Jika anda ingin mencari teks yang mengandungi bukan sahaja kata kunci anda, tetapi juga sinonimnya, maka anda boleh menggunakan operator "~" sebelum perkataan yang anda ingin cari sinonim.

Sebagai contoh:
Jenis ~ metamorfosis
~ Orientasi objek

Pengendali julat (..):
Bagi mereka yang perlu bekerja dengan nombor, Google telah membolehkan untuk mencari julat antara nombor. Untuk mencari semua halaman yang mengandungi nombor dalam julat tertentu "dari - hingga", anda perlu meletakkan dua titik (..) di antara nilai ekstrem ini, iaitu pengendali julat.

Sebagai contoh:
Beli buku $100..$150
Penduduk 1913..1935

Berikut ialah semua pengendali bahasa pertanyaan Google yang saya kenali. Saya harap mereka akan memudahkan proses mencari maklumat yang anda perlukan. Walau apa pun, saya sering menggunakannya dan saya boleh mengatakan dengan yakin bahawa apabila menggunakannya, saya menghabiskan lebih sedikit masa mencari berbanding tanpanya.

Semoga berjaya! Dan semoga Angkatan bersama anda.

Tag: carian, pengendali, Google

Dan hari ini saya akan memberitahu anda tentang enjin carian lain yang digunakan oleh pentester/penggodam - Google, atau lebih tepat tentang keupayaan tersembunyi Google.

Apakah Google Dorks?

Google Dork atau Google Dork Queries (GDQ) ialah satu set pertanyaan untuk mengenal pasti lubang keselamatan yang paling teruk. Apa-apa sahaja yang tidak disembunyikan dengan betul daripada robot carian.

Untuk ringkasnya, permintaan sedemikian dipanggil Google dorks atau hanya dorks, seperti pentadbir yang sumbernya digodam menggunakan GDQ.

Pengendali Google

Sebagai permulaan, saya ingin memberikan senarai kecil yang berguna Pasukan Google. Di antara semua arahan carian lanjutan Google, kami amat berminat dengan empat ini:

  • tapak - cari di tapak tertentu;
  • inurl - menunjukkan bahawa perkataan yang dicari harus menjadi sebahagian daripada alamat halaman/tapak;
  • intitle - pengendali carian dalam tajuk halaman itu sendiri;
  • ext atau jenis fail - cari fail jenis tertentu dengan sambungan.

Juga, apabila mencipta Dork, anda perlu mengetahui beberapa pengendali penting, yang ditentukan oleh aksara khas.

  • | - operator OR, juga dikenali sebagai garis miring menegak (logik atau), menunjukkan bahawa anda perlu memaparkan hasil yang mengandungi sekurang-kurangnya satu daripada perkataan yang disenaraikan dalam pertanyaan.
  • "" - Operator sebut harga menunjukkan padanan tepat.
  • — - operator tolak digunakan untuk mengecualikan daripada memaparkan hasil dengan perkataan yang ditentukan selepas tolak.
  • * - pengendali asterisk atau asterisk digunakan sebagai topeng dan bermaksud "apa-apa sahaja."

Di mana untuk mencari Google Dorky

Dorks yang paling menarik ialah yang segar, dan yang paling segar adalah yang ditemui oleh pentester sendiri. Benar, jika anda terlalu terbawa-bawa dengan eksperimen, anda akan dilarang daripada Google... sebelum memasuki captcha.

Jika anda tidak mempunyai imaginasi yang mencukupi, anda boleh cuba mencari dorks segar di Internet. Tapak terbaik untuk mencari dorks ialah Exploit-DB.

Perkhidmatan dalam talian Exploit-DB ialah projek Keselamatan Serangan bukan untung. Jika ada yang tidak tahu, syarikat ini terlibat dalam latihan di lapangan keselamatan maklumat, dan juga menyediakan perkhidmatan pentesting (ujian penembusan).

Pangkalan data Exploit-DB mengandungi sejumlah besar dorks dan kelemahan. Untuk mencari dorks, pergi ke tapak web dan pergi ke tab "Pangkalan Data Penggodaman Google".

Pangkalan data dikemas kini setiap hari. Di bahagian atas anda boleh mencari tambahan terkini. Di sebelah kiri ialah tarikh dork ditambah, nama dan kategori.


Laman web Exploit-DB

Di bahagian bawah anda akan menemui dorks disusun mengikut kategori.


Laman web Exploit-DB
Laman web Exploit-DB

Satu lagi laman web yang bagus ialah . Di sana anda sering boleh menemui dorks baharu yang menarik yang tidak selalunya berakhir di Exploit-DB.

Contoh penggunaan Google Dorks

Berikut adalah contoh dorks. Apabila bereksperimen dengan dorks, jangan lupa tentang penafian!

bahan ini adalah untuk tujuan maklumat sahaja. Ia ditujukan kepada pakar keselamatan maklumat dan mereka yang merancang untuk menjadi satu. Maklumat yang dibentangkan dalam artikel ini disediakan untuk tujuan maklumat sahaja. Baik editor laman web www.site mahupun pengarang penerbitan tidak bertanggungjawab terhadap sebarang bahaya yang disebabkan oleh bahan dalam artikel ini.

Pintu untuk mencari masalah laman web

Kadangkala adalah berguna untuk mengkaji struktur tapak dengan mendapatkan senarai fail di atasnya. Jika tapak dibuat pada enjin WordPress, maka fail repair.php menyimpan nama skrip PHP yang lain.

Tag inurl memberitahu Google untuk mencari perkataan pertama dalam badan pautan. Jika kami telah menulis allinurl, carian akan berlaku di seluruh badan pautan, dan hasil carian akan menjadi lebih bersepah. Oleh itu, sudah cukup untuk membuat permintaan seperti ini:

inurl:/maint/repair.php?repair=1

Hasilnya, anda akan menerima senarai tapak WP yang strukturnya boleh dilihat melalui repair.php.


Mempelajari struktur laman web di WP

WordPress menyebabkan banyak masalah untuk pentadbir dengan ralat konfigurasi yang tidak dapat dikesan. Daripada log terbuka anda boleh mengetahui sekurang-kurangnya nama skrip dan fail yang dimuat turun.

inurl:"wp-content/uploads/file-manager/log.txt"

Dalam percubaan kami permintaan mudah membenarkan saya mencari pautan terus ke sandaran dalam log dan memuat turunnya.


Mencari maklumat berharga dalam log WP

Banyak maklumat yang berharga boleh didapati daripada log. Ia cukup untuk mengetahui rupa mereka dan bagaimana ia berbeza daripada jisim fail lain. Contohnya, antara muka pangkalan data sumber terbuka yang dipanggil pgAdmin mencipta fail perkhidmatan pgadmin.log. Ia selalunya mengandungi nama pengguna, nama lajur pangkalan data, alamat dalaman, dan seumpamanya.

Log ditemui dengan pertanyaan mudah:

ext:log inurl:"/pgadmin"

Terdapat pendapat bahawa sumber terbuka- ini kod selamat. Walau bagaimanapun, keterbukaan kod sumber itu sendiri hanya bermakna peluang untuk menerokanya, dan matlamat penyelidikan sedemikian tidak selalunya baik.

Sebagai contoh, Symfony Standard Edition popular di kalangan rangka kerja untuk membangunkan aplikasi web. Apabila digunakan, ia secara automatik mencipta fail parameters.yml dalam direktori /app/config/, tempat ia menyimpan nama pangkalan data, serta log masuk dan kata laluan.

Anda boleh mencari fail ini menggunakan pertanyaan berikut:

inurl:app/config/ intext:parameters.yml intitle:index.of


f Fail lain dengan kata laluan

Sudah tentu, kata laluan kemudiannya boleh ditukar, tetapi selalunya ia kekal sama seperti yang ditetapkan pada peringkat penggunaan.

Alat penyemak imbas UniFi API sumber terbuka semakin digunakan dalam persekitaran korporat. Ia digunakan untuk mengurus segmen rangkaian tanpa wayar, dicipta berdasarkan prinsip "Wi-Fi lancar". Iaitu, dalam skim penggunaan rangkaian perusahaan di mana banyak titik capaian dikawal daripada pengawal tunggal.

Utiliti ini direka untuk memaparkan data yang diminta melalui API Pengawal UniFi Ubiquiti. Dengan bantuannya, adalah mudah untuk melihat statistik, maklumat tentang pelanggan yang disambungkan dan maklumat lain tentang operasi pelayan melalui API UniFi.

Pembangun dengan jujur ​​memberi amaran: "Sila ingat alat ini mendedahkan BANYAK maklumat yang tersedia dalam pengawal anda, jadi anda harus mengehadkan akses kepadanya! Tiada kawalan keselamatan terbina dalam alat...". Tetapi ramai orang nampaknya tidak mengambil amaran ini dengan serius.

Mengetahui tentang ciri ini dan meminta permintaan khusus lain, anda akan melihat banyak data perkhidmatan, termasuk kunci aplikasi dan frasa laluan.

inurl:"/api/index.php" intitle:UniFi

Peraturan carian am: mula-mula kita tentukan perkataan paling khusus yang mencirikan sasaran yang dipilih. Jika ini adalah fail log, maka apakah yang membezakannya daripada log lain? Jika ini adalah fail dengan kata laluan, maka di mana dan dalam bentuk apa ia boleh disimpan? Kata penanda sentiasa ditemui di beberapa tempat tertentu - contohnya, dalam tajuk halaman web atau alamatnya. Dengan mengehadkan kawasan carian dan menentukan penanda yang tepat, anda akan mendapat yang mentah Keputusan Carian. Kemudian bersihkannya daripada serpihan, menjelaskan permintaan itu.

Pintu untuk mencari NAS terbuka

Rumah dan pejabat storan rangkaian popular sekarang. Fungsi NAS disokong oleh ramai orang pemacu luaran dan penghala. Kebanyakan pemilik mereka tidak peduli dengan keselamatan dan tidak menukar kata laluan lalai seperti pentadbir/pentadbir. Anda boleh menemui NAS popular mengikut tajuk biasa halaman web mereka. Sebagai contoh, permintaan:

intitle:"Selamat datang ke QNAP Turbo NAS"

akan memaparkan senarai IP NAS yang dibuat oleh QNAP. Yang tinggal hanyalah mencari yang paling lemah di antara mereka.

Perkhidmatan awan QNAP (seperti kebanyakan yang lain) mempunyai fungsi menyediakan perkongsian fail melalui pautan peribadi. Masalahnya ialah ia tidak begitu tertutup.

inurl:share.cgi?ssid=


Mencari fail kongsi

Pertanyaan ringkas ini menunjukkan fail yang dikongsi melalui awan QNAP. Ia boleh dilihat terus dari pelayar atau dimuat turun untuk mendapatkan maklumat yang lebih terperinci.

Pintu untuk mencari kamera IP, pelayan media dan panel pentadbir web

Selain NAS, dengan pertanyaan Google lanjutan anda boleh menemui banyak lagi peranti rangkaian dengan kawalan melalui antara muka web.

Cara paling biasa untuk melakukan ini ialah skrip CGI, jadi fail main.cgi adalah sasaran yang menjanjikan. Walau bagaimanapun, dia boleh bertemu di mana-mana, jadi lebih baik untuk menjelaskan permintaan itu.

Contohnya, dengan menambahkan panggilan standard kepadanya?next_file. Akibatnya, kita mendapat dork seperti:

inurl:"img/main.cgi?next_file"

Selain kamera, terdapat juga pelayan media yang terbuka kepada sesiapa sahaja dan semua orang. Ini benar terutamanya untuk pelayan Twonky yang dikeluarkan oleh Lynx Technology. Mereka mempunyai nama yang sangat dikenali dan port lalai 9000.

Untuk hasil carian yang lebih bersih, adalah lebih baik untuk menunjukkan nombor port dalam URL dan mengecualikannya daripada bahagian teks halaman web. Permintaan itu mengambil borang

intitle:"twonky server" inurl:"9000" -intext:"9000"


Perpustakaan video mengikut tahun

Biasanya, pelayan Twonky ialah perpustakaan media besar yang berkongsi kandungan melalui UPnP. Keizinan untuk mereka selalunya dilumpuhkan "untuk kemudahan."

Pintu untuk mencari kelemahan

Data besar adalah kata kunci sekarang: dipercayai bahawa jika anda menambah Data Besar pada apa-apa sahaja, ia akan mula berfungsi dengan lebih baik secara ajaib. Pada hakikatnya, terdapat sangat sedikit pakar sebenar mengenai topik ini, dan dengan konfigurasi lalai, data besar membawa kepada kelemahan yang besar.

Hadoop ialah salah satu cara paling mudah untuk menjejaskan tera- dan juga petabait data. Platform sumber terbuka ini mengandungi pengepala terkenal, nombor port dan halaman perkhidmatan yang memudahkan untuk mencari nod yang diuruskannya.

intitle:"Maklumat nod nama" DAN inurl:":50070/dfshealth.html"


Data besar? Kelemahan besar!

Dengan pertanyaan penggabungan ini kami mendapat hasil carian dengan senarai sistem berasaskan Hadoop yang terdedah. Anda boleh berjalan-jalan terus dari penyemak imbas anda sistem fail HDFS dan muat turun sebarang fail.

Google Dorks ialah alat yang berkuasa untuk mana-mana penguji penembusan, yang bukan sahaja pakar keselamatan maklumat, tetapi juga pengguna rangkaian biasa perlu tahu tentangnya.

Adalah penting bagi mana-mana syarikat untuk melindungi data sulit. Kebocoran log masuk dan kata laluan pelanggan atau kehilangan fail sistem, dihoskan pada pelayan, bukan sahaja boleh melibatkan kerugian kewangan, tetapi juga memusnahkan reputasi organisasi yang paling dipercayai. Pengarang artikel - Vadim Kulish.

Mempertimbangkan segala-galanya risiko yang mungkin, syarikat sedang melaksanakan teknologi terkini dan membelanjakan sejumlah besar wang cuba menghalang akses tanpa kebenaran kepada data berharga.
Namun, pernahkah anda terfikir bahawa selain kompleks dan direka dengan baik serangan penggodam, wujud cara mudah mengesan fail yang tidak dilindungi dengan pasti. Ia mengenai tentang pengendali carian—perkataan ditambahkan pada pertanyaan carian untuk menghasilkan hasil yang lebih tepat. Tetapi perkara pertama dahulu.

Melayari Internet adalah mustahil untuk dibayangkan tanpa enjin carian seperti Google, Yandex, Bing dan perkhidmatan lain seperti ini. Enjin carian mengindeks banyak tapak di Internet. Mereka melakukan ini dengan bantuan robot carian yang memproses sejumlah besar data dan menjadikannya boleh dicari.

Pengendali Carian Google Popular

Menggunakan operator berikut membolehkan anda membuat proses mencari maklumat yang diperlukan lebih tepat:

* tapak: mengehadkan carian kepada sumber tertentu

Contoh: permintaan tapak:example.com akan mencari semua maklumat yang terkandung dalam Google contohnya.com.

* jenis fail: membolehkan anda mencari maklumat dalam jenis fail tertentu

Contoh: permintaan akan menunjukkan keseluruhan senarai fail pada tapak yang terdapat dalam enjin carian Google.

* inurl: - cari dalam URL sumber

Contoh: permintaan tapak:example.com inurl:admin— mencari panel pentadbiran di tapak.

* intitle: - cari dalam tajuk halaman

Contoh: permintaan tapak: example.com intitle:"Indeks"— mencari halaman di example.com dengan senarai fail di dalamnya

* cache: - cari dalam cache Google

Contoh: permintaan cache:example.com akan mengembalikan semua halaman sumber example.com yang dicache dalam sistem

Malangnya, robot carian tidak tahu bagaimana untuk menentukan jenis dan tahap kerahsiaan maklumat. Oleh itu, mereka memperlakukan sama rata artikel blog, yang bertujuan untuk pelbagai pembaca, dan sandaran pangkalan data, yang disimpan dalam direktori akar pelayan web dan tidak boleh digunakan oleh orang yang tidak dibenarkan.

Terima kasih kepada ciri ini, serta menggunakan pengendali carian, penyerang dapat mengesan kelemahan sumber web, pelbagai kebocoran maklumat (sandaran dan mesej ralat aplikasi web), sumber tersembunyi, seperti panel pentadbiran terbuka, tanpa mekanisme pengesahan dan kebenaran.

Apakah data sensitif yang boleh didapati dalam talian?

Sila ambil perhatian bahawa maklumat yang mungkin ditemui oleh enjin carian dan berpotensi menarik minat penggodam termasuk:

* Domain peringkat ketiga sumber yang dikaji

Domain peringkat ketiga boleh ditemui menggunakan perkataan "tapak:". Sebagai contoh, permintaan seperti tapak:*.example.com akan menyenaraikan semua domain peringkat ke-3 contohnya.com. Pertanyaan sedemikian membolehkan anda menemui sumber pentadbiran tersembunyi, kawalan versi dan sistem pemasangan, serta aplikasi lain yang mempunyai antara muka web.

* Fail tersembunyi pada pelayan

Pelbagai bahagian aplikasi web boleh muncul dalam hasil carian. Untuk mencari mereka, anda boleh menggunakan pertanyaan filetype:php site:example.com. Ini membolehkan anda menemui fungsi yang tidak tersedia sebelum ini dalam aplikasi, serta pelbagai maklumat tentang pengendalian aplikasi.

* Sandaran

Untuk mencari sandaran, gunakan jenis fail: kata kunci. Pelbagai sambungan fail digunakan untuk menyimpan sandaran, tetapi sambungan yang paling biasa digunakan ialah bak, tar.gz dan sql. Contoh permintaan: tapak:*.example.com jenis fail:sql. Sandaran selalunya mengandungi log masuk dan kata laluan untuk antara muka pentadbiran, serta data pengguna dan kod sumber tapak web.

* Ralat aplikasi web

Teks ralat mungkin termasuk pelbagai maklumat tentang komponen sistem aplikasi (pelayan web, pangkalan data, platform aplikasi web). Maklumat sedemikian sentiasa sangat menarik kepada penggodam, kerana ia membolehkan mereka mendapatkan lebih banyak maklumat tentang sistem yang diserang dan memperbaiki serangan mereka terhadap sumber. Contoh permintaan: tapak:example.com "amaran" "ralat".

* Log masuk dan kata laluan

Akibat menggodam aplikasi web, data pengguna perkhidmatan ini mungkin muncul di Internet. Permintaan filetype:txt "log masuk" "kata laluan" membolehkan anda mencari fail dengan log masuk dan kata laluan. Dengan cara yang sama, anda boleh menyemak sama ada mel anda atau mana-mana akaun telah digodam. Buat permintaan sahaja jenis fail:txtnama_pengguna_atau_e-mel_mel".

Gabungan kata kunci dan rentetan carian yang digunakan untuk mengesan maklumat sensitif dipanggil Google Dorks.

Pakar Google telah mengumpulkannya dalam pangkalan data awam mereka Pangkalan Data Penggodaman Google. Ini membolehkan wakil syarikat, sama ada CEO, pembangun atau juruweb, melakukan pertanyaan dalam enjin carian dan menentukan sejauh mana data berharga dilindungi. Semua dorks dibahagikan kepada kategori untuk memudahkan pencarian.

Bantuan diperlukan? Perintahkan perundingan dengan pakar ujian keselamatan a1qa.

Bagaimana Google Dorks memasuki sejarah penggodaman

Akhir sekali, berikut ialah beberapa contoh cara Google Dorks membantu penyerang mendapatkan maklumat yang penting tetapi dilindungi dengan tidak boleh dipercayai:

Kajian kes #1. Kebocoran dokumen sulit di laman web bank

Sebagai sebahagian daripada analisis keselamatan laman web rasmi bank, sejumlah besar dokumen PDF ditemui. Semua dokumen ditemui menggunakan pertanyaan "site:bank-site filetype:pdf". Kandungan dokumen itu ternyata menarik, kerana ia mengandungi rancangan premis di mana cawangan bank terletak di seluruh negara. Maklumat ini sangat menarik minat perompak bank.

Kajian kes #2. Cari data kad pembayaran

Selalunya, apabila kedai dalam talian digodam, penyerang mendapat akses kepada data kad pembayaran pengguna. Untuk mengatur akses dikongsi kepada data ini, penyerang menggunakan perkhidmatan awam yang diindeks oleh Google. Contoh permintaan: "Nombor Kad" "Tarikh Tamat Tempoh" "Jenis Kad" jenis fail:txt.

Walau bagaimanapun, anda tidak seharusnya mengehadkan diri anda kepada pemeriksaan asas. Percayai a1qa untuk penilaian menyeluruh produk anda. Lagipun, kecurian data adalah lebih murah untuk mencegah daripada menghapuskan akibatnya.