Nunca consigo resultados satisfatórios, talvez seja isso.. e ter que ir chutando palavras diferentes (ou junções delas) é um tanto trabalhoso..
De inicio é um pouco dificil mesmo e os primeiros sempre ficam estranhos. Mas uma coisa que funcionou pra mim é ver as palavras usadas pelas imagens geradas para outros usuários que eu gostava. Ai eu comparava, identificava os elementos que eu gostava e ai montava a minha.
Hoje mesmo um amigo tinha me enviado o resultado de algumas artes do Dall-E e realmente é muito realista, olhando rápido eu até achei que na verdade era uma foto