DatabaseCast 71: Pesquisas textuais, log e information retrieval

VitrineDatabaseCast71Olá, pessoal! Neste episódio, Mauro Pichiliani (Twitter | Blog), Wagner Crivelini (@wcrivelini) e e o convidado Waldemar Neto mergulham de cabeça no texto para falar sobre pesquisas textuais, logs e information retrieval. Neste episódio você vai aprender é o que fuzzy matching, entender porque o LIKE e expressões regulares NÃO vão salvar o dia, escolher o tênis para fazer exercícios, descobrir o que é a sigla ELK, ficar desconfiado com o que fazem com seus dados e discutir a polêmica: sistemas de recomendação ou a busca ajuda a converter mais no e-commerce?

LANÇAMENTO: Curso presencial de machine learning com Python ministrado pelo Mauro Pichiliani!

Veja aqui mais detalhes sobre o curso presencial de introdução ao machine learning ministrado pelo nosso co-produtor Mauro Pichiliani. Façam logo sua inscrições, pois as vagas são limitadas e estão para acabar!

 



Não deixe de nos incentivar digitando o seu comentário no final deste artigo, mandando um e-mail para  databasecast@gmail.com, seguindo o nosso twitter @databasecast, vendo informações de bastidores e as músicas do programa no nosso Tumblr e curtindo a nossa página no Facebook e no Google+ e assistindo aos nossos episódios no YouTube. Acesse o feed RSS do DatabaseCast neste link.

 

NOVA LOJA DO DATABASECAST NO ZAZZLE!

Compre a caneca Datas SQL com a sintaxe para manipulação de datas no Oracle, SQL Server, MySQL e PostgreSQL! Basta clicar na imagem abaixoFINAL_FotoColocaoReal Livro Conversando sobre Banco de dados do Mauro Pichiliani (Impresso e PDF,EPUB e MOBI)

CAPA_AMAZON_REDUZIDA_BLOGcover_front_medium

Você pode comprar a camiseta com estampa fractal Fluxo Matrix e Sonho Fractal diretamente neste link. Veja também:

feed-rss1Veja no gráfico abaixo a duração e os tempos aproximados de início e fim de cada bloco:

TamanhoEp71

Veja na tag cloud abaixo a contagem das palavras mais usadas nos e-mails, comentários e tweets do episódio anterior:

TagCloudEp71

Links do episódio:

 

Play
Esta entrada foi publicada em DatabaseCast, Podcast e marcada com a tag , , , , , , , , , , , , , . Adicione o link permanente aos seus favoritos.

6 respostas a DatabaseCast 71: Pesquisas textuais, log e information retrieval

  1. Gil Carelli disse:

    Obrigado por mais um episódio!!

  2. Luiz Felipe disse:

    Fala galera, tudo na paz? Caramba vocês estão usando big data para saber o que está ocorrendo comigo so pode rs.
    Na empresa que trabalho, processamos N sistemas de cobrança de empresas, que geral alguns logs , o pouco que estudei sobre mongodb fiquei pensando o quao interessante seria coletar esses logs e ter alguma informação relevante para a empresa,…, bem, me pediram exatamente pra fazer isso mas não faço ideia de como implementar isso , afinal, sou so um DBA Oracle sem experiencia na area, so sei que da mas não como fazer.
    Bom mas uma vez vocês adivinhando os meus problemas hehe, um abraço e ate a proxima!

  3. Nuno disse:

    Olá pessoal tudo bem?

    Apesar de não ser da área de banco de dados, eu sempre aprendo algo com o Podcast, e no programa de hoje não foi diferente.

    Como escuto o podcast desde o inicio é nítida a a evolução na qualidade do audio do cast.

    Gostaria de Sugerir um tema: Segurança em Banco de Dados.

    Gostaria de deixar um link com um caso de uso do ELK.

    https://www.elastic.co/blog/using-elastic-graph-and-kibana-to-analyze-panama-papers

    Parabéns a todos os envolvidos.

  4. Rafael Moraes disse:

    Excelente como sempre, parabéns pelo ótimo trabalho.

  5. marcelo disse:

    Obrigado Mauro e Wagner por mais esse episódio.
    Vocês nos fazem profissionais melhores e nos incentivam cada vez mais na busca pelo conhecimento.
    Gostaria de sugerir o tema de estatísticas (se possível com o Ricardo Rezende e Fabiano Amorim) e Auditorias em bancos de dados.

    Obrigado pelos excelente podcast.

  6. Marco Reis disse:

    Olá. Acabo de ouvir o episódio (um pouco atrasado) e gostaria de deixar minha contribuição para o assunto.
    Sou desenvolvedor e há uns 10 anos comecei a trabalhar com busca textual em um tribunal, onde o produto final é texto e uma boa busca é essencial para a produtividade.

    Essa parte de buscadores especializados também é muito importante. Buscadores especializados em artigos acadêmicos, médicos e jurídicos são algumas das oportunidades e, necessariamente, precisam de um tratamento linguístico particular.

    Tanto Lucene quanto seus subprojetos são a melhor escolha neste cenário, apesar de ter esse problema de adicionar uma nova ferramenta na infraestrutura. Não acho que nenhum SGBD é apropriado para essa tarefa, mesmo o Mongo. Nada chega perto nem da performance nem das funcionalidades.

    O SGBD guarda o dado original transacional, se for o caso, e o buscador fica apenas com uma cópia. Importante falar que o Lucene não deve ser seu banco de dados principal. Principalmente porque a velocidade de inclusão de registros é muito mais lenta que um Oracle, por exemplo. Ele deve ser usado apenas para pesquisa, não como armazenamento principal. Aliás, nem sei se podemos chamar esse tipo de ferramenta de banco de dados.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *