Форум Joomla! Україна
  • Головна
  • Пошук
  • Користувачі
  • Команда форуму
  • Реєстрація
  • Увійти
    Увійти
    Ім’я користувача
    Пароль:
    Забули пароль?
     
  • Реєстрація
  • Увійти
Форум Joomla! Україна Веб-розробка Пошукова оптимізація (SEO) та соціальні мережі питання про файл robots.txt


 
  • 0 голос(ів) - 0 у середньому
питання про файл robots.txt
inf4mi
Не в мережі

Member

Дописів: 119
Тем: 21
Приєднався: 24.01.2007, 09:04 AM
Репутація: 0
#1
10.02.2007, 07:32 PM
Можливо не в тему. - сорі за флуд.
питання про файл robots.txt
За умовченням там такий файл:
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /editor/
Disallow: /help/
Disallow: /images/
Disallow: /includes/
Disallow: /language/
Disallow: /mambots/
Disallow: /media/
Disallow: /modules/
Disallow: /templates/
Disallow: /installation/

Як правильно приписать  - щоб дозволити роботам сканувати ту інформацію, що на сайті (контент).
"Содержание"  - воно зберігається в папці components ???

Дякую!!!
Вічні посилання для Вашого на сайту! Краще заплатити один раз! А дурень платить кожен місяць =)
mr.Z
Не в мережі

Junior Member

Дописів: 46
Тем: 1
Приєднався: 17.11.2006, 04:56 PM
Репутація: 0
#2
10.02.2007, 08:06 PM
Тобто? Що значить знаходиться в папці components?
Взагалі-то, файл robots.txt показує які папки не сканувати роботу.
Dutch
Не в мережі

Адміністратор

Дописів: 1,190
Тем: 59
Приєднався: 28.10.2006, 04:49 PM
Репутація: 4
#3
10.02.2007, 08:09 PM
inf4mi Написав:Можливо не в тему. - сорі за флуд.
питання про файл robots.txt
За умовченням там такий файл:
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /editor/
Disallow: /help/
Disallow: /images/
Disallow: /includes/
Disallow: /language/
Disallow: /mambots/
Disallow: /media/
Disallow: /modules/
Disallow: /templates/
Disallow: /installation/

Як правильно приписать  - щоб дозволити роботам сканувати ту інформацію, що на сайті (контент).
"Содержание"  - воно зберігається в папці components ???

Дякую!!!

Нічого не потрібно прописувати.
В index.php вже вписано що потрібно роботу сканувати все що він знайде по лінках.
Єдине, що в цьому файлі ми блокуємо доступ до якоїсь інформації.
Постараюсь на днях дати більше інформації про robots.txt
Хостинг для Joomla
inf4mi
Не в мережі

Member

Дописів: 119
Тем: 21
Приєднався: 24.01.2007, 09:04 AM
Репутація: 0
#4
10.02.2007, 10:58 PM
mr.Z Написав:Тобто? Що значить знаходиться в папці components?
Взагалі-то, файл robots.txt показує які папки не сканувати роботу.

Це було припущення!!!
Тоді так в яку папку чи куди вписуються всі статті, матеріали, що розміщені на сайті, щоб цю папку випадково не закрити для сканування!!!???
Вічні посилання для Вашого на сайту! Краще заплатити один раз! А дурень платить кожен місяць =)
Dutch
Не в мережі

Адміністратор

Дописів: 1,190
Тем: 59
Приєднався: 28.10.2006, 04:49 PM
Репутація: 4
#5
11.02.2007, 03:38 AM
Всі папки, які вписані у роботі - по своїй суті і виконують роль своєрідного ядра, у якомі міститься вся інформація.
Інформація, яку ви бачите на сайті побудованого на джумлі у такому спрощеному собі та абстрагованому варіанті (не будемо зараз вдаватись в усі тонкощі), викликається через index.php та index2.php, останній виводить тільки контент без оформлення та модулів (використовується для принту чи інших завдань).

Тобто, що можна сказати:
те що все вас цікавить, вже все зроблено. Smile

Дещо про структуру Joomla:
1. User_manual - Joomla.org (pdf)
2. Все про структуру джумли для адміністратора  - Joomla.org
3. Термінологія джумли -  - Joomla.org
4. Форум по питаннях із роботою системи - Документація - Joomla.org

Про robots.txt:
1. Все о файле robots.txt по-русски
2. Как использовать инструмент анализа файла robots.txt? - Google
3. Что неправильного в моем файле robots.txt? Почему Яндекс не подчиняется тому, что там написано? - Yandex
Хостинг для Joomla
mr.Z
Не в мережі

Junior Member

Дописів: 46
Тем: 1
Приєднався: 17.11.2006, 04:56 PM
Репутація: 0
#6
11.02.2007, 01:18 PM
inf4mi Написав:Це було припущення!!!
Тоді так в яку папку чи куди вписуються всі статті, матеріали, що розміщені на сайті, щоб цю папку випадково не закрити для сканування!!!???
Всі статті зберігають не в папках, а на SQL-сервері і справді видаються через ті два файли, що описані вище. Тобто, для зчитування роботом контенту достатньо відкрити доступ лише для кореневої папки.
Kris
Не в мережі

Junior Member

Дописів: 2
Тем: 0
Приєднався: 14.10.2008, 12:07 PM
Репутація: 0
#7
05.12.2008, 09:31 AM
дякую
Tanatus
Не в мережі

Junior Member

Дописів: 9
Тем: 1
Приєднався: 20.10.2012, 05:13 PM
Репутація: 0
#8
17.10.2015, 07:57 AM
Стандартні налаштування файлу robots.txt для Joomla:

Joomla як сайт/блог
Код:
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /index.php*
Disallow: /index2.php*
Disallow: /*com_mailto #форма відправлення листів
Disallow: /*pop= #поп-ап вікна
Disallow: /*lang=ru #мовні версії (якщо треба)
Disallow: /*format= #формати
Disallow: /*print= #друк сторінок
Disallow: /*task=vote #форма голосування
Disallow: /*=watermark #водяні знаки
Disallow: /*=download #посилання на скачування
Disallow: /*user/ #користувачі
Disallow: /404 #помилка 404
Disallow: /index.php? #сторінки з параметрами
Disallow: /*? #посилання із запитаннями
Disallow: /*% #посилання з відсотками
Disallow: /*& #посилання зі знаком &
Disallow: /index2.php #дублі
Disallow: /*tag #хмаринка тегів
Disallow: /*.pdf #файли ПДФ
Disallow: /*.swf #файли Флеш
Disallow: /*=atom #RSS
Disallow: /*=rss #RSS
Allow: /images/ #відкриваємо зображення для індексації
Allow: /index.php?option=com_xmap&sitemap=1&view=xml #відкриваємо карту сайту (посилання змінюєте на власне, якщо відрізняється)
Host: site.com
Sitemap: http://site.com/адреса_карти_сайту
Host: site.com #якщо є або немає www

Для Joomla + VirtueMart
Код:
User-agent: *
Allow: /sitemap-xml.html?sitemap=1        #доступ до карти сайтів
Allow: /components/com_virtuemart/shop_image/category      #доступ до зображень категорій
Allow: /components/com_virtuemart/shop_image/product        #доступ до зображень товарів
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /includes/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Disallow: /shop/ask/
Disallow: /index.php?
Disallow: /index2.php
Disallow: /*keyword=           #пошук за ключовими словами
Disallow: /*pop=0               #проблема sh404
Disallow: /*product-search    #пошук
Disallow: /*flypage=            #товари з результатів пошуку
Disallow: /*cart                   #кошик
Disallow: /*feed                   #RSS та atom
Disallow: /404                 #помилка 404
Disallow: /*?                       #посилання з ?
Disallow: /*%                     #посилання з %
Crawl-delay: 5                    #таймаут в 5 секунд
Host: site.com
Sitemap: http://site.com/адреса_карти_сайту
Найкращий Зоомагазин

Найкращий Хостинг Joomla
Dutch
Не в мережі

Адміністратор

Дописів: 1,190
Тем: 59
Приєднався: 28.10.2006, 04:49 PM
Репутація: 4
#9
17.10.2015, 08:16 AM
Ці правила можна виключити з файлу robots.txt!

Код:
Allow: /sitemap-xml.html?sitemap=1        #доступ до карти сайтів
Карта сайту й так індексується, оскільки вона в корені сайту.

Код:
Disallow: /*keyword=           #пошук за ключовими словами
Disallow: /*product-search    #пошук
Disallow: /*flypage=            #товари з результатів пошуку
Пошук можна залишити доступним для пошукових систем. Іноді через такі сторінки найбільше заходять

Код:
Disallow: /*feed                   #RSS та atom
Дайте індексацію й фідів. Іноді деяки читалки можуть закриті фіди і не прочитати!

Код:
Crawl-delay: 5                    #таймаут в 5 секунд
Краще цей параметр не задавати — нехай пошукові системи визначають коли і як індексувати. Популярні пошукові системи не радять цього, про це навіть у вебмастері гугла вказано.
Хостинг для Joomla
Tanatus
Не в мережі

Junior Member

Дописів: 9
Тем: 1
Приєднався: 20.10.2012, 05:13 PM
Репутація: 0
#10
17.10.2015, 08:30 AM
Dutch Написав:Ці правила можна виключити з файлу robots.txt!

Код:
Allow: /sitemap-xml.html?sitemap=1        #доступ до карти сайтів
Карта сайту й так індексується, оскільки вона в корені сайту.

Код:
Disallow: /*keyword=           #пошук за ключовими словами
Disallow: /*product-search    #пошук
Disallow: /*flypage=            #товари з результатів пошуку
Пошук можна залишити доступним для пошукових систем. Іноді через такі сторінки найбільше заходять

Код:
Disallow: /*feed                   #RSS та atom
Дайте індексацію й фідів. Іноді деяки читалки можуть закриті фіди і не прочитати!

Код:
Crawl-delay: 5                    #таймаут в 5 секунд
Краще цей параметр не задавати — нехай пошукові системи визначають коли і як індексувати. Популярні пошукові системи не радять цього, про це навіть у вебмастері гугла вказано.

Можу погодитись.
Я дав просто загальні формати файлів. А кожен вже підганяє їх під свої потреби.
Найкращий Зоомагазин

Найкращий Хостинг Joomla
« Попередня | Наступна »

Переглядають цю тему: Гості: 1



Можливо схожі теми...
Тема Автор Відповіді Перегляди Останній допис
  robots.txt не найден Ольга2017 0 3,088 менш1 хвилини тому
Останній допис:

  • Версію для друку
  • Підписатися на цю тему
Швидкий перехід:

  • Команда форуму
  • Зв’яжіться з нами
  • Joomla! Україна
  • Повернутись на початок
  • Легкий режим
  • Позначити всі форуми прочитаними
  • RSS канал
Лінійний режим
Каскадний режим