Arthur
Fernandes de Morais (Comp 19):
Segue em anexo um
problema
que me foi apresentado em uma entrevista para
Software
Engineer no
Google Brasil. Também incluí um
esboço de uma possível solução.
Em relação a situações do mercado profissional, não me recordo
de um exemplo que aplique diretamente os conceitos da
disciplina de forma isolada. No entanto, atualmente estou
trabalhando em um problema de deduplicação de documentos em
larga escala. Estamos aplicando técnicas de
hashing
sensível à similaridade, especificamente o
SimHash
para analisar a proximidade textual entre documentos extensos.
Nesse caso, o mais importante está em balancear os recursos,
tanto memória quanto CPU, para solucionar o problema de modo
distribuído. Nesse sentido, a análise de algoritmos é
fundamental.