mam długi plik html (książka online) zawierającą wiele artykułów jak ten poniżej. jak powinien wyglądać kod php który zamieniłby zawartość pliku book.html w taki sposób:
HIV=> <a href="#HIV">HIV</a>
wirus HIV=> <a href="#HIV">wirus HIV</a>
cukrzyca=> <a href="#Cukrzyca">cukrzyca</a>
cukrzycą=> <a href="#Cukrzyca">cukrzycą</a>
itd czyli każde słowo ma inny link
<article>
<h1>HIV</h1>
<span class="tags">hiv, wirus hiv, aids, human immunodeficiency virus, wirus zespołu nabytego braku odporności</span>
<p><span class="subtitle">Wprowadzenie:</span> wirus HIV należy do rodziny retrowirusów z rodzaju lentiwirusów mających powinowactwo do komórek posiadających receptory CD4 (limfocytów T pomocniczych Th/helper, limfocytów B, monocytów, makrofagów, fibroblastów, komórek nerwowych), ale także pozbawionych receptorów CD4 (komórki śródbłonka naczyń, komórki Langerhansa skóry, komórki dendrytyczne węzłów chłonnych, astrocyty, oligodendrocyty, komórki prekursorowe szpiku CD34). Rezerwuar stanowią ludzie a głównym źródłem zakażenia są osoby zakażone wirusem HIV. Zakażenie przenoszone jest przez krew, kontakty seksualne, zakażone igły, skaleczenie ostrymi narzędziami, ślinę, drogą okołoporodową (wertykalnie lub przez mleko matki). Aby doszło do zakażenia poprzez ślinę potrzebna jest liczba wirusów znajdująca się w 1/2 litra śliny osoby zakażonej. Ryzyko zakażenia okołoporodowego wynosi 20-30%, natomiast poród przez cesarskie cięcie oraz zastosowanie odpowiednich leków przeciwirusowych zmniejsza prawdopodobieństwo nawet do 1-2%. Wyróżnia się wirusy HIV-1, HIV-2 oraz SIV. Białkiem gospodarza pozwalającym na wnikanie komórki wirusa jest CCR5. Wirus HIV ginie w temperaturze 56°C po 30 min, jest odporny na niskie temperatury, wrażliwy na związki chloru, aldehyd glutarowy oraz formalinę.</p>
<p><span class="subtitle">Budowa:</span> wiriony mają budowę kulistą i otoczone są otoczką lipidową zawierającą liczne białka. Pod osłonką znajduje się płaszcz białkowy (kapsyd) kryjący materiał genetyczny wirusa, który stanowi RNA. Wirion wirusa HIV posiada także odwrotną transkryptazę, białka p24, p18, gp41, gp120.</p>
<p><span class="subtitle">Zakażenie:</span> wirus HIV występuje na całym świecie. W Polsce obserwuje się od kilku lat zwiększoną liczbę nowych zakażeń w wyniku niezabezpieczonych kontaktów seksualnych, natomiast w przeszłości głównym źródłem zakażenia było stosowanie zakażonych igieł. U wielu osób zakażenie pozostaje nierozpoznane. Przy zakażeniu drogą płciową infekcji ulegają początkowo makrofagi (łagodniejszy przebieg), natomiast przy zakażeniu poprzez krew infekcji ulegają jako pierwsze limfocyty T (ostrzejszy przebieg). Pacjent jest zakaźny od pierwszych dni po zakażeniu.</p>
</article>