• Друзья! Этот ресурс создан в далеком 2019 году ;) для себя, чтобы структурировать и всегда иметь под рукой нужные решения, примеры, ссылки, описания и т.д., а при случае все это обсудить с коллегами. Если вам что-то подобное может быть интересно – присоединяйтесь! Добавляйте свои заметки! Если нужны дополнительные разделы – сообщайте!

РЕШЕНО Удалить сайт из вебархива (web.archive.org)

AndreyG

Активист
Как вы наверное уже знаете указание в robots.txt запрета не индексацию для роботов web.archive (User-agent: ia_archiver) больше не работает и сайты продолжают попадать в webarchive. Однако удалить существующий архив и далее запретить архивировать принадлежащий вам домен возможно.

Ниже описан порядок действий для удаления сайта из базы web.archive.org.

Это для случаев, когда вы продолжаете владеть доменом (для случаев, когда уже не владеете, будет отдельная тема).

Для того чтобы удалить сайт из архива специалистам webarchive нужно не только ваше волеизъявление, но и подтверждение что вы являетесь владельцем домена (и вообще что вы это вы).

В большинстве случаев помогает простой нижеследующий алгоритм (далее в качестве примера будет указан домен site.ru – если будете использовать эту инструкцию для своего домена - будьте внимательны). Итак,

1. В корне site.ru создаете файл waybackverify.txt куда пишите следующий текст:
URL/URL path to exclude: site.ru and all subdomains
Time period of domain ownership: 2011-12-25 to present
(указывайте дату с которой вы владеете доменом)
Time period to exclude: 2011-12-25 to future (указывайте период который хотите исключить из архива, если хотите все удалить - указывайте период владения, если нужен запрет на дальнейшее архивироание - укажите to future)
Registrant email: [email protected] - is publicly viewable on a WHOIS lookup listing: https://www.nic.ru/whois/?searchWord=site.ru (укажите ваш эл.адрес который можно увидеть во WHOIS и ссылку на WHOIS-сервис регистратора, где этот адрес опубликован. Если во WHOIS адрес скрыт, то временно снимите эту защиту. Если не знаете как это сделать – напишите, расскажу как, это отдельная тема).
Проверьте, что файл доступен: https://site.ru/waybackverify.txt

2. Найдите самое свежее письмо от вашего регистратора которое он написал вам по поводу данного домена (любое, например, напоминание о продлении). Сохраните это письмо как отдельный файл EML (нажмите "переслать как вложение" и получите файл). Скриншоты письма не подойдут.

Теперь пишем письмо в webarchive.
Пишем его c адреса [email protected] (указанного в WHOIS)
Пишем на адрес [email protected]

--------------
Тема письма: DMCA TakeDown Notice
Текст письма:

Dear The Internet Archive Team,

I am owner of domain and website site.ru

I request you to remove all data on the content of my site published at https://web.archive.org/web/*/site.ru
by DMCA

Verify information (ниже повторяете все, что указали в waybackverify.txt):

1. URL/URL path to exclude: site.ru and all subdomains. Time period of domain ownership: 2011-12-25 to to present
Time period to exclude: 2011-12-25 to future

2. Please check https://site.ru/waybackverify.txt
Registrant email [email protected] is publicly viewable on a WHOIS lookup listing: https://www.nic.ru/whois/?searchWord=site.ru

Thank you.

Best Regards,
Имя Фамилия
Страна, Город
Номер вашего телефона
--------------

Отправляем.
Всё!

Пожалуйста, напишите ответом в эту тему о вашем опыте взаимодействия с web.archive.org
Все вопросы также пишите в эту тему.

Обычно подобного письма хватает и ваш домен будет удален из архива в течение 3-х дней, но если можете и считаете приемлемым направьте в webarchive больше подтверждающей информации.
Вообще при подобных запросах на удаление сайтов webarchive требует сообщить им такое:
STEP 1 : LIST (a) EACH URL/URL PATH THAT YOU WISH TO EXCLUDE, (b) THE PERIOD OF YOUR OWNERSHIP, AND (c) THE PERIOD YOU WISH TO EXCLUDE (where possible, we will target an exclusion to the requested period for a verified request)
EXAMPLE 1 (multiple URLs/paths from the same domain for same time period):
URL/URL path to exclude: site1.com/dir/file.html
URL/URL path to exclude: site1.com/images/
time period of domain ownership: 2020-02-25 to present
time period to exclude: 2020-02-25 to future

EXAMPLE 2 (full domain & subdomains):
URL/URL path to exclude: site2.com (and all subdomains)
time period of domain ownership: 1998-01-31 to 2001-08-30
time period to exclude: 1998-01-31 to 2001-08-30

STEP 2 : Select and follow the applicable section(s) below for the URL(s) you want to exclude from the Wayback Machine.

A. IF YOU PERSONALLY OWN THE WEBSITE(S) for the URL(s), please help us verify your ownership for those URLs by doing one of the following:

(PLEASE NOTE: if the whois listing for the domain shows that the most recent registration was later than the period you wish to exclude, we may ask for verification of past ownership in addition to any verification of current ownership)
• Add a text file with your request to the site’s root directory (e.g., domain.com/waybackverify.txt) or to your DNS records.

• If a main email contact is identified on your site, send us your request from that address (and include a link to the place on the site where the contact is listed). Note: for companies with general customer service addresses listed as contacts and the like, we may request further verification.

• If the registrant email is publicly viewable on a WHOIS lookup listing, send us an email from that address (and a link to the whois listing where it is displayed).

• If your personal information (name, point of contact, verifiable image of self) appears on the site in a way that identifies you as owner, send us a scan of a valid photo ID bearing the same unique personal information (other sensitive information such as birth date, address, or phone number can be redacted). Please also send us a link to where it appears (not screenshots).

• Send us email communication from a hosting company or registrar addressed to you as owner of the domain (the email should reference the domain specifically). To satisfy this option, please send the email to us as an EML attachment (please do not send screenshots).

B. IF YOU REPRESENT AN ENTITY THAT OWNS ANY OF THE SITE(S) for the URL(s), please help us verify your ownership for those URLs by doing one of the following:
• Add a text file with your request to the site’s root directory (e.g., domain.com/waybackverify.txt) or to your DNS records.

• If the registrant email is publicly viewable on a WHOIS lookup listing, send us an email from that address (and a link to the whois listing where it is displayed).

• Send us email communication from a hosting company or registrar addressed to you as owner of the domain (the email should reference the domain specifically). To satisfy this option, please send the email to us as an EML attachment (please do not send screenshots).

If none of the applicable verification options are available to you and you believe there is an alternative method to clearly and definitively demonstrate your ownership, you may send us pertinent information in a reply to this email. Please understand that we will make a good faith review of any directly relevant and manageable material, but do not guarantee any outcome beforehand.
 
Последнее редактирование:

New User

New member
Здравствуйте. Можно ли как-то удалить сайт из вебархива, если доменом уже не владею? Вы говорили, что как-то можно. Подскажите пожалуйста, как это сделать. Очень нужно
 

AndreyG

Активист
Здравствуйте. Можно ли как-то удалить сайт из вебархива, если доменом уже не владею? Вы говорили, что как-то можно. Подскажите пожалуйста, как это сделать. Очень нужно
Соберите все, что вы можете представить как доказательства владения доменом в определенный период (переписка с регистратором, история платежей, ссылки на информацию из баз whois history https://www.google.com/search?q=whois+history и т.д.). И все это отправьте в вебархив.
 

Лорик

New member
Добрый день! Подскажите, пжл, если во WHOIS адрес скрыт, то временно снимите эту защиту. Ранее Вы писали "Если не знаете как это сделать – напишите, расскажу как, это отдельная тема". Спасибо огромное!
 

AndreyG

Активист
Добрый день! Подскажите, пжл, если во WHOIS адрес скрыт, то временно снимите эту защиту. Ранее Вы писали "Если не знаете как это сделать – напишите, расскажу как, это отдельная тема". Спасибо огромное!
В интерфейсе управления доменом (у регистратора) найдите опцию отображения Вашего реального email
 
Сверху