Resultados 1 a 7 de 7
  1. #1
    WHT-BR Top Member
    Data de Ingresso
    Dec 2010
    Posts
    15,042

    Acessos face:b00c

    Estou com uma "infestação" de acessos com endereços IPv6 "face:b00c" de blocos do Facebook com referrer http://www.facebook.com/externalhit_uatext.php

    Esse troço seria um proxy para imagens postadas em páginas do FB?

    Edit: Bastava eu ter clicado no link.

    Why does Facebook appear in my server logs?


    Facebook allows its users to send links to interesting web content to other Facebook users. Part of how this works on the Facebook system involves the temporary display of certain images or details related to the web content, such as the title of the webpage or the embed tag of a video. Our system retrieves this information only after a user provides us with a link. You may have found this page because a Facebook user sent a link from your website to other Facebook users.
    Última edição por 5ms; 11-11-2014 às 00:30.

  2. #2
    WHT-BR Top Member
    Data de Ingresso
    Nov 2010
    Posts
    1,611
    Acessei o link agora e está em português

    Facebook permite que seus usuários enviem links para conteúdo interessante da web para outros usuários do Facebook. Parte de como isto funciona no sistema do Facebook envolve exibição temporária de certas imagens ou detalhes relacionados ao conteúdo da web, tais como o título da página da web ou a tag embed de um vídeo. Nosso sistema retém esta informação apenas após um usuário nos prover com um link. Você pode ter encontrado esta página porque um usuário do Facebook enviou um link de seu site da web para outros usuários do Facebook. Se você tiver quaisquer questões ou preocupações sobre quaisquer links ou conteúdo enviados por um de nossos usuários, por favor contate-nos...
    oGigante.com*• Revenda de Hospedagem Cloud Linux + WHMCS Grátis
    VWhost.com.br • Revenda de Hospedagem Linux Cpanel + CloudFlare
    Zocka.com.br • Hospedagem de Sites Cpanel + Construtor de Sites

  3. #3
    WHT-BR Top Member
    Data de Ingresso
    Dec 2010
    Posts
    15,042
    A explicação está estranha porque são milhões de acessos desde sexta-feira e várias versões (temporais) da mesma imagem.

  4. #4
    WHT-BR Top Member
    Data de Ingresso
    Dec 2010
    Posts
    15,042
    Aparentemente o Facebook está indexando sites inteiros (robôs nos EUA e Europa). Concorrência com Google e Bing?

    Quem tem IPv6 fica fácil verificar nos logs de acesso face:b00c mas devem estar usando IPv4 também.
    Última edição por 5ms; 11-11-2014 às 01:24.

  5. #5
    WHT-BR Top Member
    Data de Ingresso
    Dec 2010
    Posts
    15,042
    Não é referrer, é User Agent:

    "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)"

  6. #6
    WHT-BR Top Member
    Data de Ingresso
    Dec 2010
    Posts
    15,042
    Uma análise superficial dos logs mostrou que o acesso IPv4 é raro e provavelmente condizente com http://www.facebook.com/externalhit_uatext.php mas o acesso IPv6 é maciço e aparentemente está indexando todas as páginas dos sites visitados. Além disso está reacessando as imagens de um mesmo site usando range causando resposta http status 206. A conferir.

  7. #7
    WHT-BR Top Member
    Data de Ingresso
    Dec 2010
    Posts
    15,042
    Citação Postado originalmente por chuvadenovembro Ver Post
    Acessei o link agora e está em português

    Facebook permite que seus usuários enviem links para conteúdo interessante da web para outros usuários do Facebook. Parte de como isto funciona no sistema do Facebook envolve exibição temporária de certas imagens ou detalhes relacionados ao conteúdo da web, tais como o título da página da web ou a tag embed de um vídeo. Nosso sistema retém esta informação apenas após um usuário nos prover com um link. Você pode ter encontrado esta página porque um usuário do Facebook enviou um link de seu site da web para outros usuários do Facebook. Se você tiver quaisquer questões ou preocupações sobre quaisquer links ou conteúdo enviados por um de nossos usuários, por favor contate-nos...
    Janeiro 2008:

    The only problem is, what they say is not quite true. In fact it is essentially bull dust. I set up a Facebook page and fetched images from my web site. I was able to post these images with no link to my web site. Essentially it is under the radar hot linking of images, and in the case of my web site, it is against my copyright policy, and illegal. So I wrote to legal@facebook.com asking for a fair usage fee or instructions on how to block their spider. No reply from them yet.


    Also, it does not seem to obey robots.txt

    http://www.webmasterworld.com/search...rs/3552152.htm


    Outubro 2012

    Did Facebook just implement some web crawler? My website has been crashing a couple times over the past few days, severely overloaded by IPs that I've traced back to Facebook.

    ...

    According to older sources, Facebook "does not crawl your site". But this is definitely false, as my server logs showed them crawling my site from a dozen+ IPs from the range of 69.171.237.0/24 and 69.171.229.115/24 at the rate of many pages each second.

    ...

    something has recently changed as it starting crashing us for the first time in the 8 years we have been around. Supposedly they are "updating their opengraph". However, looking at our pages it is requesting (very old obscure pages),

    We saw the same behaviour at about the same time (mid October) - floods of requests from Facebook that caused queued requests and slowness across the system. To begin with it was every 90 minutes; over a few days this increased in frequency and became randomly distributed.

    The requests appeared not to respect robots.txt, so we were forced to think of a different solution. In the end we set up nginx to forward all requests with a facebook useragent to a dedicated pair of backend servers.
    http://stackoverflow.com/questions/1...-crashing-site


    Julho 2012

    Does anyone know how tell the 'facebookexternalhit' bot to spread its traffic?

    Our website gets hammered every 45 - 60 minutes with spikes of approx. 400 requests per second, from 20 to 30 different IP addresses from the facebook netblocks. Between the spikes the traffic does not disappear, but the load is acceptable. Offcourse we do not want to block the bot, but these spikes are risky. We'd prefer to see the bot spread it's load equally over time.
    http://stackoverflow.com/questions/1...xternalhit-bot

Permissões de Postagem

  • Você não pode iniciar novos tópicos
  • Você não pode enviar respostas
  • Você não pode enviar anexos
  • Você não pode editar suas mensagens
  •