Sumarização automática de texto API

Uma das tarefas mais populares no campo da análise de texto é a sumarização. Por vezes, é referido como o gisting ou revisão automática.

Línguas suportadas: Inglês, francês, alemão, português, italiano, espanhol, japonês, chinês, grego .

Se tomarmos qualquer artigo, podemos facilmente ver que ele é baseado numa ideia central incrivelmente simples. Todo o significado de qualquer texto na linguagem natural está contido em algumas frases. Enquanto o resto do texto apenas esclarece e explica a ideia chave. A sumarização automática permite analisar o texto e encontrar uma ou várias frases que contenham a ideia central do texto. Tais algoritmos são usados em muitos sites de notícias. Quando você lida com a página principal ou a lista de artigos, você precisa de exibir um pequeno anúncio para cada texto para facilitar ao utilizador a decisão de ler o artigo. A API de sumarização permite que qualquer site ou aplicação móvel faça isso de forma totalmente automática.

Vamos dar uma olhadela mais de perto nos recursos da API automática de sumarização de texto.

Identificação das frases mais importantes

O sistema determina automaticamente o tópico principal do texto e as principais teses. Depois disso, as frases que contêm as declarações mais importantes são escolhidas a partir de todo o texto. Ao enviar um pedido para a API, você pode especificar o número das frases mais importantes que deseja receber. Se quiser criar um título de texto, especifique o número necessário de frases igual a 1.

Extraindo palavras-chave do texto

Extração de palavras-chave é um passo obrigatório no processo de sumarização de texto. O sistema não procura as palavras mais comuns no texto. Na verdade, determina as palavras mais importantes, construindo uma hierarquia de conexões e significados entre elas. A lista de palavras-chave constitui a base para determinar as frases mais importantes.

Extrair a parte mais importante

Durante o processo de sumarização do texto, as frases encontradas provavelmente serão de diferentes partes do texto. É óbvio que as teses mais importantes podem estar espalhadas pelo artigo. Uma no início, e outra perto do fim. Ao extrair as mais importantes, o sistema encontra várias frases que estão conectadas entre si, de modo a transmitir totalmente o significado do texto. Nas condições do mundo real, essa abordagem é um pouco menos comum do que a sumarização convencional do texto. Ao mesmo tempo, muitas pessoas consideram esta oportunidade importante. Se não faz ideia sobre a melhor opção para si, recomendamos-lhe que tente escolher a que é mais adequada para o seu conteúdo.