Terminam as conferências IADIS
Chegam ao fim as conferências IADIS WWW/INTERNET e Applied Computing 2011. Pela primeira vez fora da Europa, ambas tiveram taxa de aceitação de 20% e participação de mais de 20 nacionalidades diferentes. As conferências receberam trabalhos nas áreas de Information Retrieval, DataMining, Algorithms and Data Structures, e-Learmig, Distributed Computing, dentre outras.
Nosso grupo de pesquisa apresentou trabalhos em ambas as conferências. Na Applied Computing nosso artigo, Minimal Perfect Hashing and Bloom Filter Made Practical, apresentou a primeira implementação prática de uma estrutura de dados quase ótima para armazenamento de conjuntos estáticos de dados denominada Minimal Perfect Hashing Bloom Filter. Ao contrário do Bloom Filter tradicional, tal estrutura de dados apresenta tempo de busca constante independente da taxa de falso positivo e é ideal para tratar conjuntos imensos de dados em memória primária considerando o requisito de manutenção de baixa taxa de falso positivo. Na WWW/INTERNET nosso artigo, Exploiting Entity Semantics for Query Expansion, apresentou um método automático para expansão de consultas baseado na adição de termos extraídos de Infoboxes de páginas relacionadas a entidades na Wikipédia. O método proposto demonstrou a viabilidade de considerarmos a Infobox como uma fonte de informação semanticamente rica sobre entidades.
Agora é voltar a trabalhar nos nossos temas de pesquisa e pensar na próxima conferência.
Transparências em Latex, Keynote ou PowerPoint?
A mesma dúvida de sempre… Começo a pensar em fazer uma apresentação e essa pergunta me vem na cabeça. Semana que vem tenho uma 2 apresentações pra fazer no IADIS 2011 e fico me perguntando, faço em PowerPoint porque é mais rápido e tenho múltiplas opções de transições entre slides? Faço no Keynote porque é esteticamente melhor e consigo apresentar a partir do meu iPad compartilhando no iCloud? Ou faço em Latex exportando pra PDF para controlar melhor o formato das fórmulas e figuras que vão na apresentação, e ainda aproveitar texto do meu artigo fonte feito no próprio Latex?
Por enquanto a diversidade de recursos e produtividade do PowerPoint, o estilo e facilidade de compartilhamento do Keynote vão perdendo para o maior controle e reaproveitamento de textos e fórmulas do Latex.
Chega ao fim o SPIRE 2010
A 17.a edição da conferência chega ao fim com a expectativa da edição de 2012 ser no Brasil. A de 2011 já está confirmada em Pisa, Itália.
Durante os 3 dias do evento foram apresentados 41 trabalhos nos campos de processamento de strings e recuperação de informação. O evento também contou com a participação de representantes de diversos países, dentre eles Brasil, Chile, Colômbia, Espanha, Itália, Alemanha, França, Dinamarca, Japão, Canadá, Austrália, China, Índia, Israel e México.
Primeiro dia do SPIRE 2010
A 17.a edição da conferência começou hoje no hotel Hola Gran Faro em Los Cabos, México, com a presença de convidados e palestrantes bem conhecidos na área de Recuperação de Informação.
Hoje tivemos seções de Recomendação, Indexação, Teoria e Algoritmos para Tratamento de Strings.
Destaque para a palestra de Marc Najork “Querying the Web Graph”.

Montando meu “Media Center”: Parte II
Continuando a questão da montagem da minha central multimídia, depois de definidos os objetivos, vamos ao segundo passo:
2. ESCOLHENDO EQUIPAMENTOS
Antes de mais nada, tive que especificar os tipos de equipamentos necessários para o consumo do conteúdo. No meu caso, decidi que preciso de uma tela para exibição de vídeos, um equipamento que permita leitura de mídias CD, DVD e BD, uma console do jogos, um sistema de áudio com caixas de som e equipamentos que permitam conexão à internet e consumo de mídia via streaming.
Agora vem a parte difícil, a escolha dos equipamentos. São inúmeros os fornecedores e as opções disponíveis no mercado e as funcionalidade e preços variam sensivelmente de equipamento para equipamento. Para facilitar minha vida, adotei alguns critérios simples para nortear minhas escolhas:
- Atualidade: Os equipamentos possuem tecnologias atuais? Eles não ficarão sucateados em um curto período de tempo?
- Credibilidade: Os fornecedores e equipamentos são confiáveis? São reconhecidos no mercado? Tem uma boa reputação? Oferecem suporte e garantias?
- Custo: Os valores dos equipamentos estão dentro de uma média de mercado? Eles cabem no meu orçamento?
- Flexibilidade: Os equipamentos podem ser usados para múltiplas funções?
- Funcionalidade: Os equipamentos são capazes de exercer as funções necessárias para que meus objetivos sejam atingidos?
- Usabilidade: Os equipamentos são fáceis de configurar e operar?
O critério 6, muitas vezes negligenciado, é especialmente importante se existirem outras pessoas em casa que irão fazer uso dos equipamentos. Não há coisa mais irritante que sua esposa, filhos ou familiares ficarem te chamando toda hora pra ligar ou operar o sistema.
Nas próximas postagens discutirei cada uma das minhas escolhas e os próximos passos para montagem da minha central multimídia…
Montando meu “Media Center”: Parte I
Ao começar a montar uma central multimidia (Media Center ou Home Theater) lá em casa me deparei com uma série de questões técnicas e financeiras difíceis de equacionar. Foi aí que decidi encarar isso como um projeto e compartilhar minha experiência.
1. DEFININDO OBJETIVOS
O primeiro passo para quem quer instalar uma central multimídia é definir o que se esperar dela. E nesse jogo, é o conteúdo, mais especificamente à forma como o conteúdo é distribuído, que dita as regras. Não adianta você gastar em equipamentos modernos de alta definição (HD – High Definition) se você pretende assistir televisão mas ainda recebe sinal analógico por antena externa. A questão aqui é qual conteúdo multimídia você irá consumir e de que forma se dará esse consumo.
No meu caso, o consumo de conteúdo esperado é:
- Programas de televisão: assino um plano de TV à Cabo com programação digital e em alta resolução (Full HD).
- Filmes e shows em alta resolução: possuo alguns filmes e shows, mas frequentemente alugo DVDs e BDs em locadoras de vídeo. Além disso, pretendo assinar serviços de mídia por streaming, tais como NetFlix ou Hulu.
- Jogos: pretendo adquirir uma console, tal como PlayStation, Xbox ou Wii para jogar jogos.
- Conteúdo diverso da Internet.
Continuarei falando sobre isso numa próxima postagem…
Debate dos Candidatos na RedeTV
O debate entre os candidatos à presidência do Brasil promovido pela RedeTV e Folha de São Paulo demonstra o quanto eles são despreparados:
1) A Dilma acha que acrescentar “radicalmente” à sentença torna-a mais importante ou verdadeira. Além disso, gagueja e se esquiva de todas as perguntas embaraçosas sobre o governo do PT, como por exemplo no caso de violação de sigilo do imposto de renda feito por membros do PT.
2) O José Serra não consegue se posicionar de maneira clara contra ou a favor das ações do governo atual. Quer criticar mas fica cheio de dedos pra falar do presidente e do governo Lula. Além disso, insiste em exemplos usando o Estado de São Paulo. Alguém deveria avisar para ele que o Brasil não é São Paulo e que muitos estão de saco cheio dessa paulistada no poder.
3) A Marina não consegue sequer cronometrar o tempo de resposta. Toda hora pede desculpas porque acha que o tempo se esgotou. E é ridículo esse argumento de colocar uma mulher na presidência. Temos que colocar o candidato mais bem preparado.
4) O Plínio se diz contra o Real e a Política Econômica atual mas não oferece alternativa nenhuma. Em uma pergunta chegou a dizer que “não sabia e não tinha que saber”. É um piadista.
Belo Horizonte, Praça da Liberdade, Cultura e Entretenimento
Ontem a noite dei uma volta com a Daniela e o Téo na Praça da Liberdade e ficamos impressionados com a vida que existe no local nas noites de sábado. Começamos dando uma volta perto da Biblioteca Central onde o Téo adora perseguir os pássaros que ciscam no gramado em frente. Em seguida atravessamos a Avenida Bias Fortes e chegamos na praça onde nos deparamos com um grupo teatral ensaiando. Continuando nosso passeio, passamos por um corredor de roseiras floridas, onde percebi que a Dani aguardava ansiosamente que eu, românticamente, apanhasse uma rosa para ela. Fiquei envergonhado e não o fiz, afinal de contas que direito tenho eu de privar outras pessoas de apreciar tal visão? Imagine se todos tem a mesma idéia? Obviamente ela ficou um pouco decepcionada, mas seguimos em frente.
Decidimos então caminhar pelo passo central, entre as palmeiras imperiais. Em um sentido avistávamos a ampla Avenida João Pinheiro e a tradicional lanchonete na esquina, em outro sentido admirávamos a beleza do Palácio da Liberdade e da iluminação indireta incidindo sobre sua fachada. Olhando para o lado vimos as fontes iluminadas conferindo vida e movimento ao local. Nesse cenário, observamos diversos casais namorando nos bancos da praça, adolescentes fazendo algazarra no coreto, pais caminhando com filhos e alguns transeuntes passeando calmamente, talvez como nós, curtindo o local.
Cercado por aquelas edificações históricas e de arquitetura marcante misturando o tradicional e o moderno, ficou claro em minha mente que não havia melhor escolha para se implantar um novo centro cultural em Belo Horizonte do que ali. Fiquei imaginando como será passear na Praça da Liberdade depois que as obras estiverem concluídas e fixei meu pensamento em uma idéia: concluir o passeio apreciando um bom café acompanhado do pão de queijo de Minas.
Extração Automática de Informação da Wikipedia
Recentemente eu e meus orientadores tivemos um artigo aceito para publicação no SPIRE2010 (String Processing and Information Retrieval Symposium). O artigo, entitulado “A Self-Supervised Approach for Extraction of Attribute-Value Pairs from Wikipedia Articles” trata de um importante problema com impactos no campo da recuperação de informação: o problema de extração automática de informação a partir de textos. A abordagem proposta, denominada WAVE (Wikipedia Attribute-Value pair Extractor) é capaz de extrair automaticamente pares atributo-valor relacionados a entidades diretamente do conteúdo textual de artigos da Wikipedia. Esse é o primeiro passo da nossa meta de extrair automaticamente informação da Web e utilizá-la em tarefas de recuperação de informação. A íntegra do artigo aparecerá nos anais do evento, mas abaixo segue o resumo do trabalho:
Wikipedia is the largest encyclopedia on the web and has been widely used as a reliable source of information. Researchers have been extracting entities, relationships and attribute-value pairs from Wikipedia and using them in information retrieval tasks. In this paper we present a self-supervised approach for autonomously extract attribute-value pairs from Wikipedia articles. We apply our method to the Wikipedia automatic infobox generation problem and outperformed a method presented in the literature by 21.92% in precision, 26.86% in recall and 24.29% in F1.
Catalogação e classificação de vinhos no iPhone
Uma dica para quem aprecia vinhos e, como eu, deseja catalogar e classificar os vinhos que já experimentou. O Wine Notes permite você fazer isso, além de tirar fotos da garrafa para não esquecer e ainda fazer backup dos dados direto do seu iPhone.