- Exemplo 1: Selecionar as colunas a manter
- Exemplo 2: Escolher as colunas a eliminar
- Exemplo 3: Selecionar as linhas a manter com base na condição
Aqui estão as três formas mais comuns de subconjunto de um conjunto de dados no SAS:
Método 1: Escolher as colunas a manter
data new_data; set original_data; keep var1 var3; run ;
Método 2: Escolher as colunas a eliminar
data new_data; set original_data; drop var4; run ;
Método 3: Escolher as linhas a manter com base na condição
data new_data; set original_data; if var1 <25 then delete; run ;
Os exemplos seguintes mostram como utilizar cada método com o seguinte conjunto de dados no SAS:
/*criar conjunto de dados*/ data original_data; input equipa $ pontos ressaltos; datalines ; Warriors 25 8 Wizards 18 12 Rockets 22 6 Celtics 24 11 Thunder 27 14 Spurs 33 19 Nets 31 20 ; run ; /*ver conjunto de dados*/ proc print data =original_data;
Exemplo 1: Selecionar as colunas a manter
O código a seguir mostra como fazer o subconjunto de um conjunto de dados usando o MANTER para manter apenas determinadas colunas:
/*criar novo conjunto de dados*/ dados novos_dados; set dados_originais; manter pontos da equipa; executar ; /*ver novo conjunto de dados*/ proc imprimir dados =novos_dados;
Exemplo 2: Escolher as colunas a eliminar
O código a seguir mostra como fazer o subconjunto de um conjunto de dados usando o DROP para eliminar colunas específicas:
/*criar um novo conjunto de dados*/ data new_data; set original_data; drop points; run ; /*ver o novo conjunto de dados*/ proc print data =new_data;
Exemplo 3: Selecionar as linhas a manter com base na condição
O código a seguir mostra como fazer o subconjunto de um conjunto de dados usando o APAGAR para eliminar linhas específicas do conjunto de dados em que o valor na declaração pontos é inferior a 25:
/*criar novo conjunto de dados*/ dados novos_dados; set dados_originais; if pontos <25 then delete; run ; /*ver novo conjunto de dados*/ proc print dados =novos_dados;
Também é possível utilizar o OU " " para eliminar as linhas em que pontos é inferior a 25 ou ressaltos é inferior a 10:
/*criar novo conjunto de dados*/ data dados_novos; set dados_originais; if pontos <25
Também é possível utilizar o E " & " para eliminar as linhas em que pontos é inferior a 25 e ressaltos é inferior a 10:
/*criar um novo conjunto de dados*/ dados novos_dados; set dados_originais; if pontos <25 & ressaltos <10 then delete; run ; /*ver o novo conjunto de dados*/ proc print dados =novos_dados;