Пошук інформації в мережі інтернет

1657

Стаємо професіоналами пошуку інформації в інтернеті

Всім привіт! У сьогоднішній статті я розповім вам про те, як навчитися швидше і якісніше відшукувати потрібну вам інформацію. Одного разу мені, з обов’язку служби, довелося виконувати замовлення, інформації щодо якого було зовсім мало і знайти її було важко. Доводилося перелопачувати підлогу інтернету, щоб знайти потрібну інформацію. Саме в той момент, я вирішив ближче познайомитися з розширеними можливостями пошукових систем. В результаті знайомства були знайдені цікаві способи пошуку, які в подальшому дуже допомогли закінчити той складний проект.

Існують три основні способи пошуку інформації в Інтернет:

  • Вказівка адреси сторінки.
  • Пересування по гіперпосиланнями.
  • Звернення до пошукової системи (пошуковому серверу).
  • Про останньому пункті і поговоримо далі. У цій статті мова піде про відомих пошукових системах, про принципи їх роботи і про розширені можливості пошукових систем. Ви дізнаєтеся деякі цікаві способи пошуку і отримаєте масу корисних порад, які неодмінно полегшать вам пошук потрібної інформації в інтернеті.

    Зміст:

    Як працюють системи веб-пошуку
    Що можна знайти через пошуковики
    Шукаємо інформацію професійно. 5 корисних способів пошуку в Google
    7 корисних порад при пошуку інформації
    «Гарячий» розширений пошук від Google. 16 Способів

    Як працюють системи веб-пошуку

    За даними сервісу статистики LiveInternet.ru розподіл пошукових систем в Росії приблизно наступне:

  • Яндекс – 53.9%
  • Гугл – 35.0%
  • Пошук Mail.ru – 8.3%
  • Рамблер – 0.9%
  • Яндекс (картинки) – 0.6%
  • Гугл (картинки) – 0.2%
  • поиск информации в интернете

    Дані сервісу статистики LiveInternet.ru

    Тепер, щоб краще зрозуміти, як працюють пошукові системи, зробимо короткий огляд механізму роботи. Пошукова система працює в такому порядку:

    • Збір даних пошуковим роботом павуком (Web crawling)
    • Індексація знайдених даних (Indexing)
    • Пошук за індексами даними (Searching)

    Збір даних пошуковим роботом павуком

    Зазвичай ділиться на 2 етапи – завантаження веб-сторінки і аналіз посилань. Перший етап виконує Spider (швидкий пошуковий павук) – програма для послідовного перебору і завантаження веб-сторінок для аналізу. Вона отримує веб-сторінки з сайтів за певним алгоритмом і віддає їх іншій програмі Crawler-у. Після цього в справу вступає Crawler (повільний павук аналізатор), який знаходить всі посилання і становить подальший маршрут для spider-а. У spider-а є певний список сайтів для відвідування заздалегідь підготовлений іншими підсистемами пошуку. З цього списку spider отримує всі необхідні дані.

    Індексація знайдених даних

    Після того, як проходить перший етап, в справу вступає друга підсистема – підсистема індексації. Вона розміщує знайдену павуками інформацію так, щоб було зручно в подальшому до неї звертатися. Для цього програма Індексатор розбирає сторінку на різні її частини і аналізує їх. Сторінки виділяються заголовки сторінок, посилання, текст, структурні елементи і т. д. Всі отримані дані структуруються за певним алгоритмом і потім отримані дані заносяться в базу даних.

    Пошук за індексами даними

    Ця підсистема видачі результатів, яка використовує сформовану индексатором базу даних. Вона визначає, які сторінки задовольняють запиту користувача і показує результати пошуку. Коли ви вводите ключове слово і робите пошук, пошукова система відбирає результати на підставі наступних критеріїв:

  • Title (заголовок): Є ключове слово в заголовку?
  • Domain/URL (Домен/адреса): Є ключове слово в імені домену або в адресі сторінки?
  • Style (стиль): Аналіз стилю тексту на сторінки. Використовується Жирний текст або Курсив, використовуються заголовки H1, H2 і т. д.
  • Density (щільність): Як часто вжито ключове слово на сторінці? Яка величина щільності ключового слова?
  • MetaInformation (мета дані) – пошук збігів у метаданих.
  • Outbound Links (посилання назовні): Є посилання на сторінці і на кого вони ведуть, а також зустрічається ключове слово в тексті посилання?
  • Inbound Links (зовнішні посилання): Хто посилається на потрібну сторінку? Який текст посилання?
  • Insite Links (посилання всередині сторінки): На які сторінки даного сайту містить посилання ця сторінка?
  • Рекомендую до прочитання: Оновлення Алгоритму Google – mobile-friendly

    В результаті цього порівняння підсистема пошуку вибирає потрібні веб-сторінки і показує їх користувачеві, який здійснює пошук.

    Що можна знайти через пошуковики

    Технічно можна знайти будь-яку інформацію, яка проіндексована пошуковими системами, перебувати в загальному доступі в мережі інтернет і не заборонена політикою пошукової системи. При пошуку в інтернеті майте на увазі наступне:

    • Більша частина інформації в інтернеті не контролюється і будь-яка людина з комп’ютером та доступом в інтернет може публікувати інформацію. Тому потрібно розуміти, що дані можуть бути недостовірними.
    • Не завжди легко дізнатися хто автор знайденої інформації.
    • Ви не завжди знаєте, звідки надходить інформація.
    • Інформація може бути упередженою, спеціально вводить в оману, або просто невірної.
    • Дата публікації даних може бути не зазначено і буде важко зрозуміти, чи є актуальною інформація.

    Найчастіше люди шукають через пошук (розташоване приблизно за спаданням):

  • Всілякі соціальні мережі – Вконтакте, Facebook, Однокласники, mail.ru і т. д
  • Порно
  • Фільми
  • Картинки
  • Музику
  • Інтернет
  • Авто
  • Youtube
  • Ігри онлайн
  • Комп’ютери
  • Гроші, фінанси
  • Відпочинок
  • Нерухомість
  • Спорт
  • Реклама
  • Будівництво
  • Здоров’я
  • Інформацію про знаменитостей
  • Приготування страв, кулінарія
  • Логістика
  • Заробіток в інтернеті
  • Приблизно 2-3% від всіх введених запитів зазвичай сформульовані питання. Найбільше питальних запитів починаються з:

    • який
    • скільки
    • хто

    Останнім часом все більше запитів (близько 10%) стали містити пряму вказівку – купити, продати або отримати щось. Найпоширеніші уточнення сьогодні в рунеті – це завантажити безкоштовно і безкоштовно. Приблизно 4% від усіх запитів. Найбільш часто зустрічаються, помилками при пошуку – помилки, що виникають із-за невірної розкладки клавіатури, недописані запити та синтаксичні помилки.

    Методи пошуку інформації в інтернеті

    5 корисних способів пошуку в Google

    Отже, давайте розглянемо кілька хитрих способів пошуку інформації через пошукову систему. Для прикладу, використовуємо Google (напевно не зовсім вдалий приклад, ну да ладно :) ).

    Ситуація 1 – Пошук на зображенні: Є зображення або логотип якоїсь програми або компанії, і ви хочете знайти докладну інформацію про нього.

    Наведу приклад. Я одного разу побачив на стінах у дворі приблизно наступне зображення:

    как осуществить поиск информации в интернете

    Значок пацифістів

    і ніяк не міг пригадати, звідки воно взялося. Написати в пошуку – «Коло, всередині якого паличка і ще 2 палички» навряд чи що-небудь дав :) . Ось тут і приходить нам на допомогу сервіс пошуку картинок по цифровому коду зображення від Google. Малюємо на швидку руку зображення в будь-якому графічному редакторі і перетягуємо його в пошук google по картинках.

    как осуществить поиск информации в интернете

    Пошук по картинці

    Зазвичай, в результатах пошуку по картинках можна завжди знайти шукане, головне – це більш-менш стерпно намалювати. Т. к. художник з мене ніякий, то результати пошуку залишу в секреті :)

    Інший приклад. Є логотип компанії, наприклад такий:

    поиск информации в ресурсах интернет

    Логотип Інфініті

    Логотип лише для прикладу, бо як його напевно багато хто знає. Перетягуємо його мишкою в поле для пошуку і бачимо що вийшло:

    поиск нужной информации в интернете

    Пошук компанії по логотипу

    Іноді зображення накладені один на одного в одній картинці. Щоб знайти потрібний рисунок, доведеться його акуратно скопіювати яким-небудь графічним редактором, виділивши потрібну область. Якщо ви добре володієте яким-небудь графічним редактором, то перш ніж шукати по зображенню, його можна обробити і почистити від зайвого шуму. Тоді результат пошуку буде набагато якісніше.

    Ситуація 2 – Пошук всередині файлів з певним розширенням. Для того, щоб шукати текст у файлах, потрібно ввести в пошукову рядок наступну команду: filetype:xls шуканий текст. Xls в даному випадку – це розширення файлів Excel. Тобто пошукова машина буде шукати текст всередині файлів з вказаним розширенням. Наприклад: filetype:xls звіт. У підсумку отримуємо все Excel файли, в яких зустрічається слово звіт:

    работа в интернете поиск информации

    Пошук за типом файлу

    Таким чином можна, наприклад завантажити шаблон якого-небудь документа, ну або сам документ :) , якщо його спеціально в загальний доступ поклали або просто забули захистити.

    Рекомендую до прочитання: Google оптимізація

    Для пошуку доступні наступні типи файлів:

    • pdf – пошук зазначеного тексту всередині pdf файлів
    • dwf файли програми AutoCAD
    • ps – файли Adobe Post Script, спеціальні сценарії для виводу високоякісного векторної графіки на принтери і плотери
    • kml або kmz файли програми Гугл Планета Земля(Google earth)
    • xls – файли програми Microsoft Office Excel
    • ppt файли програми Microsoft Office Power Point
    • doc – файли Microsoft Office Word
    • rtf – файли Rich Text Format, підтримувані більшістю текстових редакторів
    • swf – файли програвача флеш-плеєра Shockwave Flash
    • txt – пошук всередині звичайних текстових файлів

    Ситуація 3 – Шукаємо точне входження пошукової фрази. Іноді потрібно знайти точне входження фрази в якомусь тексті. В принципі тут два шляхи. Перший підхід – введіть у пошуковий рядок точну і досить довгу пошукову фразу і пошукова система знайде текст, який найбільш точно містить те, що ми шукаємо. Чим більше і точніше буде пошуковий запит, тим більш точний збіг знайде пошукова машина (якщо звичайно така інформація присутня в мережі інтернет).

    Другий підхід – обрамляти лапками пошукову фразу. У цьому випадку фраза може складатися з невеликої кількості слів. Наприклад, вводимо – “Великі міста”, отримуємо:

    помощь в поиске информации в интернет

    Пошук за вашим входження фрази

    Але якщо ми спробуємо ввести між цими двома словами в лапках щось безглузде, то пошук не дасть результатів. І навіть якщо вставити одну безглузду букву, пошук не дасть результатів, хоча пошукова система і спробує запропонувати нам підходящі варіанти.

    Ситуація 4 – Пошук інформації тільки по одному певного сайту або домену. Якщо вам потрібно знайти інформацію з певного сайту, то… можна скористатися пошуком, який є на сайті ну або спробувати знайти щось за допомогою пошукові системи Google. Дивишся, і знайдеться щось, що не хотів (чи не зміг) шукати вбудований в сайт пошук. Для цього вводимо в пошуковий рядок наступне вираз: Різне site:livejournal.ru Різне – це текст, який ви шукаєте, все що після site: це доменне ім’я сайту, на якому потрібно шукати.

    браузеры поиск информации в интернете

    Пошук по сайту

    Той же механізм працює для доменів. Замість імені сайту можна вказати в якому домені шукати інформацію, наприклад: Закон site:gov, де .gov — загальний домен верхнього рівня для урядових організацій.

    Ситуація 5 – Пошук інформації по електронній пошті. Іноді необхідно знайти інформацію по людині або організації, але на руках є тільки адреса електронної поштової скриньки (e-mail). Якщо ввести в пошукову рядок адресу поштової скриньки, то можна знайти всі сайти і ресурси, де людина залишав свій email. Можна також знайти домени, які зареєстровані на цю скриньку.

    технология поиска информации в интернете

    Пошук по email

    Ще один спосіб пошуку – це використання оператора, який дозволяє заповнити пошуковий запит довільним текстом і частиною поштової адреси. Наприклад можна знайти поштові скриньки співробітників компанії, написавши *@имякомпании.ги для прикладу *@microsoft.com

    7 корисних порад при пошуку інформації

  • Складати пошуковий запит потрібно так, щоб максимально звузити кількість варіантів у видачі
  • Фільтрування по часу – це дозволить знайти більш-менш актуальну інформацію. Благо зараз всі великі пошукові системи надають розширений пошук, в якому можна встановити діапазон дат.
  • Коректне питання, що задається пошуковику, повинен складатися як мінімум з двох ключових слів тоді пошуковику буде набагато простіше відшукати потрібну інформацію
  • Для пошуку інформації використовувати різні пошукові машини. Незважаючи на те, що всі пошуковики побудовані на загальних принципах, алгоритми у них можуть різнитися. Тому може статися так, що те, що не зміг знайти Yandex, Google видасть
  • Якщо ви шукаєте які-небудь товари чи послуги у вашому місті, уточнюйте регіон пошуку(наприклад Москва). Це зменшить кількість результатів, але знайдені результати будуть більш релеванты вашим пошуковим запитам
  • Використовуйте більше іменників для пошуку.
  • Використовуйте синоніми, якщо за запитом не було знайдено те, що потрібно
  • Рекомендую до прочитання: Трохи про SEO.

    Головний фактор успішного і швидкого пошуку – це формулювання запиту пошукової системи. Якщо ви вмієте зміркувати, які потрібні ключові слова для вас влаштовує результату – ви король пошуку!

    «Гарячий» розширений пошук від Google. 16 способів

    Деякі методи я вже торкався вище, деякі ще немає. Наводжу для повноти весь список.

    Виключення з Google пошуку

    Щоб виключити з пошукової видачі якесь слово, фразу, символ і т. п., досить перед ним поставити знак “-” (мінус), і воно не з’явиться в результатах пошуку. Для прикладу, я ввів в рядок пошуку наступну фразу: “безкоштовний хостинг – ru” і в пошуковій видачі немає жодного .ru сайту, крім оплачених рекламних оголошень.

    Пошук по синонімів

    Використовуйте символ “~” для пошуку схожих слів до вибраного. Наприклад в результаті висловлення: “~кращі фільми -кращі” ви побачите всі посилання на сторінки, що містять синоніми слова “кращі”, але жодне з них не буде містити цього слова.

    Невизначений пошук

    На той випадок, якщо ви не визначилися з конкретним ключовим словом для пошуку, допоможе оператор “*”. Наприклад фраза “кращий редактор * зображень” підбере найкращі редактори для всіх типів зображень, будь то цифрові, растрові, векторні і т. д.

    Пошук на вибір з варіантів

    Використовуючи оператор “|”, можна здійснити Google пошук по декільком сполученням фраз, замінюючи кілька слів у різних місцях. Наприклад, введемо фразу “купити чохол | ручку” видасть нам сторінки, що містять або “купити чохол”, або “купити ручку”

    Значення слова

    Щоб дізнатися значення того чи іншого слова, досить ввести в пошукову рядок “define:” і після двокрапки шукану фразу.

    Точний збіг

    Для знаходження точного збігу пошукової видачі із запитом досить укласти ключевики в лапки.

    Пошук по певному сайту

    Щоб здійснити пошук ключових слів тільки по одному сайту, достатньо додати до шуканої фразою наступний синтаксис – “site:”.

    Зворотні посилання

    Щоб дізнатися розташування посилань на цікавий сайт, достатньо ввести наступний синтаксис: “links:” і далі адресу цікавить сайту.

    Конвертер величин

    Пошукова система Google також уміє конвертувати величини за запитом користувача. Наприклад, нам потрібно дізнатися, скільки становить 1 кг в фунтах. Набираємо наступний запит: “1 кг в фунтах”

    Конвертер валют

    Для того, щоб дізнатися курс валют за офіційним курсом, набираємо наступний пошукової запит: “1 [валюта] [валюта]”

    Час по місту

    Якщо хочете дізнатися час на якомусь місту, то використовуйте синтаксис: “time” або російський аналог “час” і назва міста.

    Google калькулятор

    Google вміє рахувати онлайн! Досить вбити приклад в рядок пошуку і він видасть результат.

    Пошук за типами файлів

    Якщо вам необхідно знайти щось по конкретному типу файлу, то у Google є оператор “filetype:” який здійснює пошук за заданим розширенням файлу.

    Пошук кешувати сторінки

    У Google є власні сервера, де він зберігає кешовані сторінки. Якщо потрібна саме така, то скористайтеся оператором: “cached:”

    Прогноз погоди по місту

    Ще одним оператором пошуку у Google є оператор погоди. Досить вбити “weather” і місто, як ви побачите, буде у вас дощ чи ні

    Перекладач

    Можна перекладати слова відразу, не відходячи від пошуковика. За переклад відповідає наступний синтаксис: “translate [слово] into [мова]”

    P. S. Комбінуючи різні варіанти параметрів можна дуже сильно скоротити діапазон пошуку і знайти те, що потрібно. Сподіваюся, наведені вище приклади допоможуть вам у пошуку інформації.

    Попередня статтяОстанній патч disco elysium спрямований на те, щоб зробити текст дійсно читабельним
    Наступна статтяНудота тексту