subject
Informática, 03.05.2021 04:20 melissamoraes402

PYTHON Neste projeto, você irá trabalhar com dados que tem a mesma origem que o projeto anterior: a Scene Attribute Dataset. O objetivo é usar os dados textuais desse conjunto de dados para criar vetores que descrevem os arquivos de imagens, possibilitando o uso de algoritmos de aprendizado de máquina nesses dados. O foco neste projeto é analisar os dados para se obter um vetor que caracterize todo o conjunto.

A ideia é que os objetos presentes em cada imagem sejam usados para a construção de um vetor que a descreve. Na figura a seguir, cada ponto representa um vetor que descreve uma imagem. Chamaremos esse elemento (vetor) de amostra. Essa ilustração é bidimensional, mas na prática usamos vetores com muito mais dimensões. O objetivo final deste trabalho é identificar o vetor mais representativo de todo o conjunto de amostras.

imagem no anexo 1

Uma maneira de fazer isso é simplesmente calcular a média (ou centro de massa) de todas as amostras -- que é o que deve ser feito para a tarefa 3. Porém, há algumas desvantagens nisso. Por exemplo, o centro de massa pode ser afetado pela presença de vetores ruidosos (outliers), tais como aqueles que ficam bem distantes de todo o resto. Além disso, trata-se de um vetor sintético, construído simplesmente pela média das variáveis. Para algumas aplicações, é bem melhor interpretar o resultado com base na seleção da amostra real que seja a mais representativa. Isso é possível calculando a distância entre todos os pares de amostras e a identificação de qual delas tem, na média, a menor distância a todas outras, como ilustrado na figura abaixo -- isso é o que deve ser feito para a tarefa 4.

imagem no anexo 2

Informações relevantes:

Propagação de erros: Assim como no projeto anterior, aconselhamos que sempre que for executada uma sequência de cálculos, execute-a de maneira a minimizar a propagação de erros. Por exemplo, para se calcular a média entre as variáveis A, B e C, calcule desta forma: (A+B+C)/3, e não desta: A/3 + B/3 + C/3. Apesar de serem matematicamente equivalentes, na segunda forma há mais propagação de erros.

Tipo de dados: Apesar dos dados serem fornecidos como números inteiros, é importante que todas operações matemáticas sejam feitas com números de ponto flutuante. Ao imprimir dados numéricos como valores sem ponto flutuante, não converta dados para inteiro. Use f-strings e imprima seus números como sendo números de ponto flutuante, mas sem casas decimais.

É permitido o uso de bibliotecas padrão do Python. Note que numpy, pandas e scikit-learn não estão incluídas entre as bibliotecas padrão.

Entrada:

Os dados são fornecidos exatamente no mesmo formato que no projeto 1:

T N

nome_do_arquivo_1
atributo-objeto_1
x1 y1 x2 y2

nome_do_arquivo_2
atributo-objeto_2
x1 y1 x2 y2

.
.
.
nome_do_arquivo_N
atributo-objeto_N
x1 y1 x2 y2

Tarefas e saída de dados:

As tarefas 1 e 2 são tarefas relacionadas à construção de vetores que descrevem as amostras (imagens). A tarefa 3 se refere a computar a média (centro de massa) desses vetores e a tarefa 4 se refere a identificar qual das amostras é a mais representativa de todas elas.

1. Vetor de indicadores de objetos (T=1):

Reformatar os dados de forma que eles fiquem mais úteis para o método a ser implementado. Para cada imagem, imprima apenas uma linha contendo o nome do arquivo seguido por 16 números binários (separados por um espaço em branco). Cada número indica a presença/ausência de objetos (independentemente da cor ou ponto de vista do objeto), nesta ordem:

1 - bison
2 - elephant
3 - horse
4 - ibis
5 - sky
6 - mountain
7 - building
8 - flower
9 - sand
10 - tree
11 - field
12 - road
13 - tower
14 - ocean
15 - cliff
16 - waterfall

Saída:
Para esta tarefa, a saída de dados tem o seguinte formato:

nome_do_arquivo1 x1 x2 x3 ... x16
nome_do_arquivo2 x1 x2 x3 ... x16
.
.
.
nome_do_arquivoF x1 x2 x3 ... x16

Onde x1, ..., x16 assumem valores 0 ou 1, indicando a ausência ou presença, respectivamente, de cada objeto listado acima na imagem referente ao nome_do_arquivo. Note que o número de linhas na saída F ≤ N, pois em geral cada imagem possui mais de uma caixa de objeto.


PYTHON

Neste projeto, você irá trabalhar com dados que tem a mesma origem que o projeto anterior:
PYTHON

Neste projeto, você irá trabalhar com dados que tem a mesma origem que o projeto anterior:

Respostas
Respostas: 1

Outra pergunta: Informática

question
Informática, 15.08.2019 00:38
Os chamados “computadores pessoais” (personal computer – pc) são utilizados em empresas dos mais variados portes e segmentos, auxiliando as pessoas a executarem suas tarefas com mais rapidez e eficiência. entretanto, atualmente eles não são a única opção disponível no mercado. uma série de equipamentos inteligentes e dispositivos de acesso à informação oferecem acesso à internet e recursos, para executar tanto tarefas básicas quanto avançadas de computação. os dispositivos móveis são classificados como assistentes digitais e estão entre os recursos mais populares na categoria dos dispositivos de acesso à informação. esses dispositivos possuem capacidade de acesso à web e utilizam tela sensível ao toque, permitindo que seus usuários desempenhem diversas tarefas por meio de uma interface amigável e simplificada. considere uma empresa que atua no ramo da construção civil em diversas cidades do interior do estado de são paulo, cujo foco de atuação é a venda de imóveis residenciais na planta. os gestores da empresa definiram no planejamento estratégico que os seus funcionários que atuam com a venda direta dos imóveis aos clientes seriam apoiados nesta tarefa pelo uso de tecnologias modernas. sendo assim, adquiriram um tablet e um smartphone de última geração para cada um dos vendedores, mas ainda não especificaram como eles deverão ser utilizados no processo de venda. esta é a sua tarefa: especifique pelo menos três maneiras pelas quais os vendedores poderiam utilizar os equipamentos tecnológicos durante todas as atividades do processo de venda dos imóveis.
Respostas: 1
question
Informática, 16.08.2019 21:49
Tem menina que joga free fire se tiver passa o nick para formar escolhe bora subir para mestre só falta mais uma menina já tem dois meninos e uma menina aí falta mais dormir passa o nick ai por favor! ​
Respostas: 1
question
Informática, 17.08.2019 16:52
Assinale a alternativa que não condiz com a característica de veracidade dos dados no contexto de big data. a. a qualidade ou limpeza, consistência e acurácia dos dados; b. os dados foram gerados internamente ou externamente à organização. c. se os dados poderão ser públicos, como números de telefone ou dados comportamentais a partir dos dados agregadores. d. os dados que são produzidos possuem uma vida útil muito curta , por isso as organizações devem ser capazes de analisa-los quase em tempo real, se eles esperam encontrar ideias e oportunidades nestes dados. e. a origem ou fonte de dados ao longo do tempo e sua evolução ou linhagem.
Respostas: 3
question
Informática, 10.04.2014 05:06
1 na história de “uma pescaria inesquecível” foi possível perceber que: i. aquele menino, agora adulto, sempre vê o mesmo peixe todas as vezes que se depara com uma questão ética; ii. como o pai lhe ensinou, a ética é simplesmente uma questão de certo ou errado; iii. agir corretamente, quando se está sendo observado, é uma coisa.a ética, porém, está em agir corretamente quando ninguém está nos observando. iv. essa conduta reta só é possível quando, desde criança, aprendeu-se a devolver o peixe à água.assinale a alternativa correta: a afirmativa i está correta e ii incorreta a afirmativa ii está correta e iii incorreta a afirmativa iii está correta e iv incorreta as afirmativas i e iii estão incorretas as afirmativas i, ii, iii e iv estão corretas2 no microcomputador, temos 3 barramento que são os mais utilizados. quando falamos de cpu, o barramento que troca informações entre a unidade de controle (u.c) e a unidade lógica aritmética é o : barramento de endereçamento. barramento vesa. barramento de controle barramento de dados. barramento pci.3 assinale a alternativa correta em arquitetura de computadores: i. memória ram é o responsável pelo armazenamento dos dados no computador, mesmo após ser desligado; ii. cpu é responsável pelo armazenamento e processamento dos dados de um computador; iii. hd é o responsável pelo armazenamento das informações do computador; iv. pen-drive armazena informações em uma memória do tipo definitivo. a alternativa correta é: as afirmações iii e iv estão corretas; apenas a afirmação ii está correta; apenas a afirmação iii está correta as afirmações i e ii estão corretas; as afirmações ii e iii estão corretas 4em tecnologia da informação os equipamentos podem ser classificados conforme o seu porte. mainframe é: um grande pacote de dados. um pacote de dados principal.um microcomputador remoto. um computador de médio porte. um computador de grande porte5 sobre o texto “ética do profissional da informática” analise as afirmativas a seguir: i. muitos autores definem a ética profissional como sendo um conjunto de normas de conduta que deverão ser postas em prática no exercício de qualquer profissão; ii. a ética profissional estudaria e regularia o relacionamento do profissional com sua clientela, visando a dignidade humana e construção do bem estar no contexto sociocultural onde exerce sua profissão; iii. aquele que só se preocupa com os lucros, geralmente tende a ter menor consciência de grupo. iv. fascinado pela preocupação monetária, a ele pouco importa o que ocorre com sua comunidade e muito menos com a sociedade.assinale a alternativa correta: apenas a afirmativa iv está incorreta as afirmativas i, ii, iii e iv estão corretas a afirmativa i está correta e ii incorreta a afirmativa ii está correta e iii incorreta a afirmativa iii está correta e iv incorreta6 em relação à arquitetura de computadores podemos afirmar que: i. os principais componentes do computador são processador, memória e dispositivos de armazenamento de informações. ii. no processador é composto a uc e a ula; iii. o computador em sua busca de endereços sempre trabalha com números decimais. as afirmações ii e iii estão corretas apenas a afirmação i está correta apenas a afirmação ii está correta; apenas a afirmação iii está correta as afirmações i e ii estão corretas; 7 de acordo com hierarquia de memórias, qual destas memórias está no topo da pirâmide, possuindo a característica de possuir menor capacidade de todas, porém possui maior velocidade e custo? memória principal. memória cache. disco rígido. registrador. pen drive.8 assinale a alternativa correta com relação ao tamanho do ip.v6: 128 bits 132 bits 140 bits 144 bits100 bits.
Respostas: 1
Você sabe a resposta certa?
PYTHON Neste projeto, você irá trabalhar com dados que tem a mesma origem que o projeto anterior:...
Perguntas
question
Matemática, 25.02.2021 22:00
question
Matemática, 25.02.2021 22:00
question
História, 25.02.2021 22:00
question
Física, 25.02.2021 22:00
question
Português, 25.02.2021 22:00
question
História, 25.02.2021 22:00