Assistente visual

Serviço de aplicativo do Azure
Serviço de Bot da IA do Azure
Serviços de IA do Azure

Ideias de soluções

Esse artigo é uma ideia de solução. Caso deseje que ampliemos o conteúdo com mais informações, como possíveis casos de uso, serviços alternativos, considerações sobre implementação ou diretrizes de preços, fale conosco enviando seus comentários no GitHub.

Essa solução apresenta um assistente visual que fornece informações avançadas baseadas no conteúdo de uma imagem.

Arquitetura

Diagrama de arquitetura que mostra o fluxo de dados entre um navegador e um bot e entre o bot e os serviços de pesquisa.

Baixe um Arquivo Visio dessa arquitetura.

Fluxo de dados

  1. Os usuários interagem com um bot por meio de um aplicativo móvel ou um aplicativo Web.
  2. O bot usa o LUIS (Serviço de Inteligência de Reconhecimento Vocal), que é integrado ao aplicativo, para identificar a intenção do usuário e o contexto de conversa.
  3. O bot passa o contexto visual, como uma imagem, para a API de Pesquisa Visual do Bing.
  4. O bot recupera informações da API de Pesquisa de Entidade do Bing sobre pessoas, locais, obras de arte, monumentos e objetos relacionados à imagem.
  5. O bot recupera informações de códigos de barras.
  6. Opcionalmente, o bot obtém mais informações sobre códigos de barras ou consultas limitadas ao domínio do usuário usando a API de Pesquisa Personalizada do Bing.
  7. O assistente visual apresenta ao usuário as informações sobre produtos, destinos, celebridades, locais, monumentos e obras de arte relacionadas.

Componentes

  • O Serviço de Aplicativo do Azure é um serviço totalmente gerenciado baseado em HTTP para hospedar aplicativos Web, APIs REST e back-ends móveis.
  • O Serviço de Bot do Azure oferece um ambiente para desenvolver bots inteligentes de nível empresarial que enriquecem as experiências do cliente. O ambiente integrado também fornece uma maneira de manter o controle de seus dados.
  • A API de Pesquisa Personalizada do Bing fornece uma maneira de criar experiências de pesquisa personalizadas com a classificação avançada do Bing e o índice de pesquisa em escala global.
  • A API de Pesquisa de Entidade do Bing oferece recursos de pesquisa que identificam entidades relevantes, como pessoas conhecidas, locais, filmes, programas de TV, videogames, livros e empresas.
  • A API de Pesquisa Visual do Bing retorna dados relacionados a uma determinada imagem, como imagens semelhantes, fontes de compras para comprar o item na imagem e páginas da Web que incluem a imagem.
  • A API de Pesquisa na Web do Bing fornece resultados de pesquisa depois que você emite uma única chamada à API. Os resultados compilam informações relevantes de bilhões de páginas da Web, imagens, vídeos e notícias.
  • OServiço Cognitivo do Azure para Linguagem faz parte dos Serviços Cognitivos do Azure que oferecem muitos serviços de processamento de linguagem natural.
  • A Compreensão da linguagem coloquial é um recurso do Serviço Cognitivo para Linguagem. Esse serviço de API baseado em nuvem oferece recursos de inteligência de aprendizado de máquina para a criação de aplicativos de conversação. Você pode usar o LUIS para prever o significado de uma conversa e extrair informações relevantes e detalhadas.

Detalhes do cenário

Essa solução apresenta um assistente visual que fornece informações avançadas baseadas no conteúdo de uma imagem. As funcionalidades do assistente incluem ler cartões de visita, decifrar códigos de barras e reconhecer pessoas conhecidas, locais, objetos, obras de arte e monumentos.

Possíveis casos de uso

As organizações podem usar essa solução para fornecer:

  • Agendamento de compromisso.
  • Acompanhamento de pedidos e entregas em aplicativos de fabricação, automóveis e transporte.
  • Compras de código de barras no varejo.
  • Processamento de pagamento em finanças e varejo.
  • Renovações de assinatura no varejo.
  • A identificação de pessoas conhecidas, lugares, objetos, arte e monumentos, nas indústrias de educação, mídia e entretenimento.

Próximas etapas