Aprender similaridade visual e textual é o fundamento de tarefas como agrupamento, recuperação de informação e detecção de faces. O estado da arte nestas tarefas normalmente requer o treinamento de um modelo capaz de aprender a distância entre imagens ou textos. O aprendizado desta distância é tema de uma área estabelecida em aprendizado de máquina conhecida como aprendizado de métrica que nos últimos anos tem sido dominada pelas versões baseadas em aprendizado profundo. Neste curso iremos aprender a transformar o algoritmo de aprendizado profundo de sua preferência como resnet, efficientnet, coatnet, bert ou gpt em um algoritmo de aprendizado de métrica que pode ser aplicado em textos ou imagens. Na parte prática do curso iremos construir um reconhecedor de face capaz de entregar um modelo no estado da arte em reconhecimento facial quando treinado em grandes conjuntos de dados.
Edson Takashi Matsubara possui graduação em Bacharelado Em Informática pela Universidade de São Paulo (2002), mestrado em Ciência da Computação Icmc São Carlos pela Universidade de São Paulo (2004) e doutorado em Ciências da Computação e Matemática Computacional pela Universidade de São Paulo (2008). Atualmente é professor Associado da Universidade Federal de Mato Grosso do Sul. Coordenador e Fundador do Laboratório de Inteligência Artifical (LIA) em 2009. Foi coodenador da pós-graduação em Ciência da Computação entre 2013 e 2016. Desde 2001 atua em fundamentos de Aprendizado de Máquina já tendo realizado pesquisas em agrupamento, aprendizado supervisionado, aprendizado semissupervisionado, métricas de avaliação de algoritmos, calibração e ranking. Atualmente trabalha com fundamentos de aprendizado de máquina e tem um forte viés para problemas aplicados em texto, imagens e séries temporais.
Currículo lattes: http://lattes.cnpq.br/1842905075999080