Няма нищо интересно за разказване - играем си с реализиране на embarassingly parallel алгоритми върху GPU-та. Password cracking-а е идеален пример за това, съответно скоростта, с която GPU-то ги изпълнява е много по-висока, отколкото CPU-тата. Примерно един и същ алгоритъм (MD5), thread-нат, оптимизиран за входни данни с дължина до 16 байта и използващ SSE2, върху PhenomX4 извършва около 34 милиона операции/секунда. Върху Radeon HD6870 (която е среден клас видеокарта) прави в определени случаи близо 2.9 милиарда операции/секунда. Но точно това се отдава на паралелизация и е идеален пример. Други задачи не могат толкова ефективно да се възползват. И обикновено е забавно предизвикателство да оптимизираш GPU код