Arthur
Fernandes de Morais (Comp 19):
Segue em anexo um problema que me foi apresentado em uma
entrevista para Software Engineer no Google
Brasil. Também incluí um esboço de uma possível solução.
Em relação a situações do mercado profissional, não me recordo
de um exemplo que aplique diretamente os conceitos da
disciplina de forma isolada. No entanto, atualmente estou
trabalhando em um problema de deduplicação de documentos em
larga escala. Estamos aplicando técnicas de hashing
sensível à similaridade, especificamente o SimHash
para analisar a proximidade textual entre documentos extensos.
Nesse caso, o mais importante está em balancear os recursos,
tanto memória quanto CPU, para solucionar o problema de modo
distribuído. Nesse sentido, a análise de algoritmos é
fundamental.