Monthly Archives: April 2009

Caso The Pirate Bay: culpados?

Image Hosted by ImageShack.usFoi divulgada hoje a sentença do caso The Pirate Bay (já comentei antes sobre ele aqui). Em pauta, uma disputa entre a IFPI (entidade que representa diversas gravadoras e produtoras do mundo inteiro) e os proprietários do site de compartilhamento de arquivos, por violação de direitos autorais. A sentença: 1 ano de prisão e multa de 30 milhões de coroas suecas (o equivalente a R$7,7 milhões, de acordo com a Folha Online).
O interessante no caso é o fato de o The Pirate Bay ser um site que não fornece os arquivos em si – trata-se de um sistema de busca de torrents que possibilita que as pessoas possam trocar partes de arquivos entre si, em uma rede peer-to-peer. O perigo da decisão é que ela abre precedentes (ao menos na Suécia, país em que foi proferida a decisão) para se poder processar, por exemplo, sites como o Google que, embora não hospedem conteúdos ilegais, fornecem mecanismo de busca para que esses conteúdos sejam encontrados.
A matéria do The Guardian sobre o caso traz o link para uma linha do tempo do The Pirate Bay, reproduzida abaixo:

Os condenados anunciaram que pretendem recorrer da decisão. Enquanto isso, há um aviso no site onde se lê: “Don’t worry – we’re from the internets. It’s going to be alright. :-)”

Mais Twitter como fonte de informações

Matthew Hurst, do blog Data Mining, diz estar esperando ainda por um estudo definitivo que compare o tempo que uma novidade leva para aparecer no Twitter e em outras mídias sociais (ele fala em tempo de latência). O seguinte caminho é proposto:

1. Pegar alguns dados do Twitter e extrair algumas URLs.
2. Usar a busca do Twitter para encontrar a primeira menção a essas URLs.
3. Usar um sistema de busca de blogs para encontrar a primeira menção na blogosfera.
4. Vice versa.

Antes de mais nada, eis que surge a pergunta: é tão relevante assim saber quem disse primeiro algo, ser o primeiro a dizer alguma coisa… ou o que realmente importa é onde primeiro as pessoas ficaram sabendo das coisas? (Ou, quem sabe, indo mais longe ainda… será que no fundo o que importa mesmo não seria simplesmente ficar sabendo de algo, independentemente de quando?) Nesse caso, importa realmente se um blog ou se um Twitter noticiou primeiro um fato, ou quem sabe seria bem mais interessante fazer o estudo ao contrário, perguntando por que meio as pessoas ficaram sabendo daquilo?
Além do mais, mesmo que os blogs, os jornais, ou seja lá o site ou meio que for, tenha dado a informação antes, se a pessoa viu primeiro no Twitter, por estar permanentemente lá, isso já não bastaria para dar primazia ao Twitter como fonte de informações?
Mas, enfim, tentando seguir os passos propostos por Hurst, primeiro tive dificuldade em entender os trending topics do Twitter – muitas vezes se tratam de palavras soltas, ou siglas. Nesse sentido, o What The Trend ajudou bastante. Como não achei nenhum tópico potencialmente interessante, e também não faria sentido tentar refazer o caminho de informações distantes da nossa realidade, resolvi pegar um exemplo brasileiro.
Tentei seguir o roteiro apresentado por ele, porém esbarrei em questões de ordem prática: nem sempre blogs possuem timestamp em seus posts. Claro, tem o RSS para buscar a hora aproximada da publicação, mas a busca pela hora se torna mais trabalhosa ainda. Também não achei um link recente cuja URL pudesse usar para poder comparar entre blogs e Twitter (as pessoas do Twitter falam muito de coisas sobre o próprio Twitter, presos numa metalinguagem e auto-referenciação ad nauseum que raramente se espalha para outras redes – ok, isso é tema para outro post). Mas para não ficar sem ao menos tentar o experimento, tentei localizar na busca do Twitter e no Google Blog Search a primeira menção à morte do cientista Crodowaldo Pavan. Em ambos os sistemas, busquei apenas pela palavra “Pavan”, em todos os idiomas. No Twitter, a primeira menção parece ser este tweet, cuja hora (via Twitter) é 1:15PM do dia 3 de abril. No Google Blog Search, a primeira menção vem da Agência de Notícias da USP, com 1:50PM como horário de publicação (aliás, não me pergunte por que o Google Blog Search procura também em agências e portais de notícias). No começo da tarde do mesmo dia vários blogs de ciência passaram a comentar o ocorrido, mas em geral todos eles citam a própria USP, ou outros jornais, como fonte. Isso quer dizer que o pessoal do Twitter ficou sabendo antes? Não necessariamente. Quem segue a usuária que fez o tweet, e, dos que seguem, quem estava online na hora da atualização, pode ter ficado sabendo antes. E os demais? Mais comentários no Twitter sobre o caso só foram aparecer por volta das 3 da tarde, quando outros sites passaram a noticiar o ocorrido – foi por volta dessa hora, também, que o link da própria USP apareceu no Twitter.
Não é preciso ir tão longe para saber que o Twitter pode ser mais ágil. O próprio blog do Twitter, no ano passado, já nos mostrou um gráfico com o tempo que o terremoto na California levou para sair no Twitter e em agências de notícias. Ok, o Twitter é mais rápido. Mas será que mais gente ficou sabendo pelo Twitter mesmo, ou minutos depois pelo despacho da AP? E como fica no caso daqueles que eventualmente twittaram depois de ver o despacho da AP?
Aí retomo a pergunta: importa saber quem falou primeiro sobre o caso, ou o que nos interessa reter, seja porque vimos no Twitter, em blogs, em jornais, ficamos sabendo na Internet, no rádio, na TV, pela vizinha, pelo colega, por um parente, enfim, é que determinado fato aconteceu? E, nesse caso, importa mais a informação em si, ou também seria interessante observar como se chegou a essas informações – por que meio, de que modo, em que condições?
Tenho cada vez mais perguntas do que respostas. Dois anos *de mestrado* vai ser pouco tempo para resolver essas inquietações…

Só pra constar: eu fiquei sabendo pelo Plurk…