Supervisor
Thiago A. S. Pardo
Master's candidate
Alessandro Bokan Garay
Multi-document summarization is the task of automatically producing a unique summary from a group of texts on the same topic. With the huge amount of available information in the web, this task is very relevant. This research plan proposes to investigate a multi-document summarization problem by using informative "aspects", which follows the deep approach for summarization, in which it aims at interpreting the texts to produce more informative summaries. Aspects, in particular, represent the information units in texts and summaries, e.g., in news texts there should be the following information: "what happened", "when it happened", and "where it happened".
O objetivo principal desta pesquisa é investigar métodos de sumarização multidocumento, usando informações significativas fornecidas pelos aspectos informativos presentes nos textos de origem, que ajudarão na seleção e organização do conteúdo para a formação de sumários coerentes. Portanto, visa-se identificar automaticamente, por meio de um classificador, aspectos informativos em textos utilizando técnicas de aprendizado de maquina, e criar pelo menos um método de seleção e organização de conteúdo com base em padrões organizacionais de aspectos em sumários.