А как стоят нещата с тези програми, когато сайта ползва база данни?
Тези програми не правят разлика дали съдържанието на страницата, към която са насочени, е статично вписано във файловете на страницата или е взето от база данни - обхождането се прави само върху вече генерирания HTML код, в резултат на GET заявка към тази страница и после към всички други URL адреси, които бъдат намерени в този генериран HTML код, отново с GET заявки. Тези програми не правят обхождания с POST заявки. Например, ако в страницата има поле за търсене, което обикновено изпълнява POST заявка, и според написаното в него, кодът на сайта да изкара съответните данни от база данни, тези програми няма да го изпълнят. Ще изтеглят картинката на бутона за търсене, ако има такава, ще изтеглят разни придружаващи стила картинки, ако има такива, ще изтегли flash клипа, ако се окаже, че тази форма на търсене е реализирана с flash, но няма да изпълни никакви POST заявки през тази форма, в резултат на които да се генерира още съдържание за сваляне от записите в базата данни. Сваля се единствено каквото има налично в генерирания HTML код на страниците с GET заявки. Ако в генерирания HTML код присъства някакъв JavaScript код, този код ще бъде наличен в изтегления HTML код на съответната страница, както и ще се обходи съдържанието в URL адресите, вписани в този JavaScript код, но JavaScript кодът няма да бъде изпълнен (или, ако бъде изпълнен, ще бъде изпълнен само във варианта по подразбиране, съответстващ за тази GET заявка), така че програмите за рекурсивно сваляне няма да обходят варианти на страницата, достъпни само след допълнително изпълнение на JavaScript и/или Ajax.
Правя локално копие на сайта ( при някои не става ) на харда и си го гледам на спокойствие. Предполагам, че се изгражда същата структура, както е в оригинал.
Предполагам, че не правиш локално копие на сайта с пълно рекурсивно сваляне, а запазваш страницата с функцията "Запазване на страницата" в браузъра. В този случай като файлове с HTML код се изтегля само текущата страница във вид, какъвто се е генерирал, и съпътстващите я картинки, CSS файлове, JavaScript файлове и други файлове, достъпни като URL адреси в този HTML код, но не водещи към друга страница в сайта или към друг сайт. Ако страницата, която си изтеглил така, е изцяло достъпна с GET заявка, тогава ще е в този си вид, в който си я гледал и преди това в браузъра. Ако има някакво външно съдържание, то ще бъде заредено, когато отвориш запазената страница, тъй като URL адресите им ще бъдат вписани в HTML кода на запазената страница.
Или имаш предвид друго запазване на сайта?