Automatische Berechnung von Grenzwerten und Implementierung in Mathematica

eine kanonische Differentiation definiert werden.

Definition 3.1 : (Hardykörper) (vgl. [Har10])
Ein Körper $ℋ \subseteq 𝒦 / \sim$ heißt Hardykörper, wenn er abgeschlossen ist bezüglich der Differentiation. $ℋ_{0}$ sei dabei die Menge $ℋ ∖ {0}$ . Jede Funktion eines Hardykörpers ist damit stetig und beliebig oft differenzierbar in einer Umgebung um Unendlich.
Formal sei darauf hingewiesen: Im Folgenden wird oft von Funktionen

f \in ℋ

gesprochen, obwohl natürlich eine beliebige Funktion f der Klasse

f_{\sim} \in ℋ

gemeint ist. Insbesondere beziehen sich Aussagen über Intervalle

[x_{0}, ∞)

auf unterschiedliche Intervalle, je nach gewähltem Vertreter der Klasse, und nicht auf ein gemeinsames Intervall der gesamten Klasse.

Ist

ℋ

ein Hardykörper und

f \in ℋ_{0}

, so existiert wegen der Körpereigenschaft

1 / f

und ist ebenfalls in einer Umgebung um Unendlich differenzierbar. Daher muss

f (x) \neq 0

in einer ganzen Umgebung von Unendlich gelten.

Damit ist jede Funktion

f \in ℋ

in einer geeigneten Umgebung um Unendlich immer ganz positiv, ganz negativ oder identisch 0. Da das gleiche für

f'

gilt, ist jede Funktion

f \in ℋ_{0}

in einer Umgebung von Unendlich streng monoton, und für

f \in ℋ

gilt:

{lim}_{x \to ∞} f (x)

existiert und ist entweder eine reellwertige Konstante oder

\pm ∞

ℝ (x)

, der Körper der rationalen Funktionen, ist ein Hardykörper, und bildet man den Abschluss bezüglich der Funktionen

f \to exp (f)

und

f \to log | f |

, so erhält man auch einen Hardykörper, genannt

ℒ

-Körper, der Körper der exp-log Funktionen. (vgl. [Har10])

3.2 Wachstumsklassen

Für die Analyse von Termausdrücken auf ihr Grenzwertverhalten benötigen wir einen Vergleichsmaßstab, um Funktionen nach ihrem Wachstumsverhalten zu ordnen. Im Folgenden werden gleich zwei Äquivalenzklasseneinteilungen eingeführt, um damit das Wachstum von Termen zu vergleichen. Die erste Klasseneinteilung wird dabei abgeschlossen bezüglich der Multiplikation mit Konstanten sein, die zweite wird abgeschlossen bezüglich der Potenzierung ihrer Funktionen sein und damit abgeschlossen bezüglich der Verkettung mit bestimmten rationalen Funktionen.

Definition 3.2 :
Für $a, b \in ℋ_{0}$ gelte $a \approx b$ genau dann, wenn ${lim}_{x \to ∞} a (x) / b (x) \in ℝ ∖ {0}$ ist. Für $a \in ℋ_{0}$ schreiben wir $v (a)$ für die Äquivalenzklasse von a und $Υ = {v (a) | a \in ℋ_{0}}$ für die Menge aller Äquivalenzklassen.

Theorem 3.3 : (vgl. [Ros83], Th.4 und [Gru96] Th.3.4)
Mit $v (a) + v (b) = v (ab)$ bildet $(Υ, +)$ eine Abelsche Gruppe, die mittels
$v (a) > v (b) : \Leftrightarrow lim_{x \to ∞} a (x) / b (x) = 0$
vollständig geordnet ist. Außerdem gilt für $a, b \in ℋ_{0}$ :

$v (1) = 0$ .

$v (a^{- 1}) = - v (a)$ .

$v (a^{n}) = n \cdot v (a), n \in ℤ$ (mit der Multiplikation auf $Υ$ definiert als Summierung).

$v (a) > 0$ genau dann, wenn ${lim}_{x \to ∞} a (x) = 0$ .

$v (a) = 0$ genau dann, wenn ${lim}_{x \to ∞} a (x) \in ℝ ∖ {0}$ .

$v (a) < 0$ genau dann, wenn ${lim}_{x \to ∞} a (x) = \pm ∞$ .

Wenn $a + b \in ℋ_{0}$ ist, dann gilt $v (a + b) \geq min (v (a), v (b))$ .

Wenn $a + b \in ℋ_{0}$ und $v (a) \neq v (b)$ ist, dann gilt $v (a + b) = min (v (a), v (b))$ .

Wenn $a + b \in ℋ_{0}$ und $v (a + b) > min (v (a), v (b))$ ist, gilt ${lim}_{x \to ∞} a (x) / b (x) = - 1$ (und damit $v (a) = v (b)$ ).

Wenn $v (a) \neq 0 \neq v (b)$ , dann $v (a) \geq v (b)$ genau dann, wenn $v (a') \geq v (b')$ .

Wenn $v (b) \neq 0$ , dann $v (a) > v (b)$ genau dann, wenn $v (a') > v (b')$ .

Wenn $v (a) \neq 0 \neq v (b)$ , dann $v (a) = v (b)$ genau dann, wenn $v (a') = v (b')$ .

(1)-(9) folgen leicht aus der Definition. (10)-(12) folgen aus dem Satz von de l'Hôpital.

(7), (8) und (9) kann auf ganz $ℋ$ ausgedehnt werden mit der Definition $v (0) = + ∞$ .

Beachte:

v (x^{2}) < v (x) < v (1)

, was der intuitiven Bedeutung von 'kleiner' nicht entspricht. (7) bedeutet umgangssprachlich also: a+b wächst langsamer oder gleich schnell, als die schneller wachsende der beiden Funktionen, a oder b. (8) beschreibt die Dominanz des stärkeren Wachstums, und (9) den Fall, dass sich das Wachstum von a und b gegenseitig aufhebt.

Zum Abschluss noch ein paar Beispiele für Wachstumsklassen und deren Anordnung:

\begin{array}{l} v (1 / x) > v (1) > v (ln x) > v ((ln x)^{10}) > v (x^{0.1}) > v (x) \\ > v (x ln x) > v (x (ln x)^{10}) > v (x^{1.1}) > v (x^{10}) > v (e^{0.1 x}) > v (e^{x}) > v (e^{10 x}) \end{array}

Man sieht an diesen Beispielen bereits, dass die Funktionen

x, e^{x}, ln x

eigene kleine Gruppen bilden, die sich auch durch das Potenzieren mit beliebigen positiven Zahlen nicht überschneiden. Gemischte Terme wie

x (ln x)^{k}

können diese Gruppe unterbrechen und bilden darin gleich wieder eine eigene Gruppe.

Diese Einteilung in Wachstumsklassen ist noch ungeeignet, um das Wachstum von Termen jenseits von Unendlich ausreichend einschätzen zu können. Versuchen wir also, das Gruppenverhalten, das

x^{n}

von

e^{x}

trennt, durch einen weiteren Wachstumsbegriff zu erfassen.

3.3 Noch einmal Wachstumsklassen

Wir kommen zur zweiten Äquivalenzklasse. Ziel ist, die Äquivalenzklasse abgeschlossen bezüglich rationaler Operationen zu gestalten. Ist

f \in ℋ_{0}

, und

g (x) = \sum_{k = 1}^{n} a_{k} x^{k} (a_{n} \neq 0)

, so ergibt sich

v (g (f)) = n \cdot v (f)

. Das Potenzieren vervielfacht also die Wachstumsklasse, und damit kann kein Vielfaches von

v (x)

jemals

v (e^{x})

erreichen. Deswegen zielt die nächste Definition darauf, Funktionen, die sich in der ersten Wachstumsklasse durch endliche Vielfache unterscheiden, zusammen zu fassen. Darüber hinaus ist es sinnvoll, das Wachstum von

f

und

1 / f

ebenfalls zu einer Klasse zusammen zu fassen.

Definition 3.4 :
Zwei Funktionen $f, g \in ℋ_{0}$ sind in der gleichen Wachstumsklasse, geschrieben $f \approx g$ , genau dann, wenn $m, n \in ℕ$ existieren mit $m | v (f) | \geq | v (g) |$ und $n | v (g) | \geq | v (f) |$ . Wir schreiben $γ (f)$ für die Äquivalenzklasse von f.
Außerdem gelte $f ≻ g : \Leftrightarrow γ (f) > γ (g)$ genau dann, wenn $n | v (g) | < | v (f) |$ für alle $n \in ℕ$ gilt.

Theorem 3.5 :
Für $f, g \in ℋ_{0}$ gilt:
$f ⪰ g \Leftrightarrow \exists n \in ℕ : n | v (f) | \geq | v (g) |$ .

$v (f) = v (g) \Rightarrow γ (f) = γ (g)$ .

$γ (f^{n}) = γ (f)$ für alle $n \in ℤ ∖ {0}$ .

$γ (f) = γ (1) \Leftrightarrow v (f) = 0$ .

$γ (1) \leq γ (f)$ für alle $f \in ℋ_{0}$ .

Für $f, g \to + ∞$ gilt $f \approx g$ genau dann, wenn $v (f^{m} / g) \leq 0$ und $v (g^{n} / f) \leq 0$ ist.

$γ (f g) \leq max {γ (f), γ (g)}$ .

Für $γ (f) \neq γ (g)$ gilt: $γ (f g) = max {γ (f), γ (g)}$ .

(1) - (5) folgen fast unmittelbar aus der Definition.
Zu (6): Es gilt $v (f) < 0, v (g) < 0$ . Damit ist $v (f^{m} / g) = - m | v (f) | + | v (g) | \leq 0$ genau dann, wenn $m | v (f) | \geq | v (g) |$ gilt.

Zu (7): Sei o.B.d.A. $γ (f) \geq γ (g)$ . Dann gibt es nach (1) ein $n \in ℕ$ mit $n | v (f) | \geq | v (g) |$ . Damit folgt: $| v (f g) | = | v (f) + v (g) | \leq | v (f) | + | v (g) | \leq (n + 1) | v (f) |$ , und daraus folgt $γ (f) \geq γ (f g)$ .

(8) beweist man am einfachsten unter Zuhilfenahme von Lemma 3.8 weiter unten.

Definition 3.6 :(Wachstumsverhältnis)
Sei $f, g \in ℋ_{0}$ , $v (f) \neq 0 \neq v (g)$ . Dann heißt der Wert
$R (f, g) : = lim_{x \to + ∞} \frac{ln | f (x) |}{ln | g (x) |}$
die Wachstumsverhältnis von f und g.
Dieser Wert eignet sich sehr gut, um das Wachstumsverhalten zweier Funktionen zu vergleichen, wie wir im folgenden Theorem sehen werden. Gleichzeitig ist die Funktion einfach genug zu berechnen, und damit sehr gut für Computeralgebrazwecke zu verwenden.

Theorem 3.7 : (vgl. [Gru96] Th. 3.5 und Lem. 3.6)
Sei $f, g \in ℋ_{0}$ , $v (f) \neq 0 \neq v (g)$ . Dann gilt:
$\begin{array}{ll} f \approx g & \Leftrightarrow R (f, g) \in ℝ ∖ {0} \\ f ≺ g & \Leftrightarrow R (f, g) = 0 \\ f ≻ g & \Leftrightarrow R (f, g) = \pm ∞ \end{array}$

Wegen der Bedeutung dieses Zusammenhangs hier der Beweis:

Zunächst kann man o.B.d.A davon ausgehen, dass $f \geq 0, g \geq 0$ gilt, da alle Aussagen vorzeichenunabhängig sind. Weiterhin kann man von $f, g \to + ∞$ und damit von $v (f) < 0, v (g) < 0$ ausgehen: Falls $f \to 0$ oder $g \to 0$ , kann der Beweis mit $1 / f$ oder $1 / g$ geführt werden.
Dann gilt folgende Äquivalenz:

\begin{array}{ll} m v (f) < v (g) \\ \Leftrightarrow v (f^{m} / g) < 0 \\ \Leftrightarrow lim f^{m} / g = + ∞ \\ \Leftrightarrow lim e^{m ln f - ln g} = + ∞ \\ \Leftrightarrow lim m ln f - ln g = + ∞ \\ \Leftrightarrow lim ln (g) (m \frac{ln f}{ln g} - 1) = + ∞ \end{array}

Analog folgt

n v (g) < v (f) \Leftrightarrow lim ln (f) (n \frac{ln g}{ln f} - 1) = + ∞

.

Gibt es nun m,n mit

m | v (f) | \geq | v (g) |

und

n | v (g) | \geq | v (f) |

, so kann im Gleichheitsfalle einfach m oder n erhöht werden, und die Aussage gilt damit auch für '>'. Da

v (f) < 0, v (g) < 0

ist, kann die Betragsbildung ersetzt werden, und es gilt

m v (f) < v (g)

und

n v (g) < v (f)

und damit, wie oben gezeigt,

lim ln (g) (m \frac{ln f}{ln g} - 1) = + ∞

und

lim ln (f) (n \frac{ln g}{ln f} - 1) = + ∞

. Da bereits

ln f, ln g \to + ∞

gilt, muss

lim m \frac{ln f}{ln g} \geq 1

und

lim n \frac{ln g}{ln f} \geq 1

gelten. Das ist aber nur möglich, wenn

lim \frac{ln f}{ln g}

weder 0 noch

\pm ∞

ist.

Gilt umgekehrt

lim \frac{ln f (x)}{ln g (x)} \in ℝ^{+} ∖ {0}

, so gilt für hinreichend großes m,n

lim m \frac{ln f}{ln g} > 1

und

lim n \frac{ln g}{ln f} > 1

, und der obige Rechenweg lässt sich umkehren.

Für

f ≺ g

ergibt sich analog

lim ln (g) (n \frac{ln f}{ln g} - 1) = - ∞

für alle

n \in ℕ

. Dazu muss

n \frac{ln f}{ln g} - 1 < 0

für alle n gelten, beziehungsweise

lim \frac{ln f}{ln g} < \frac{1}{n}

. Das ist aber nur für

lim \frac{ln f}{ln g} = 0

erfüllt.

Die Funktion

R (f, g)

ist in doppelter Hinsicht sehr interessant. Zum einen bietet sie ein einfaches Kriterium, um das Wachstum von Funktionen zu vergleichen, ohne dabei auf die Existenz oder Nichtexistenz von Abschätzungskonstanten angewiesen zu sein.

Zum anderen stellt der Wert von

R (f, g)

eine Ordnungsbeziehung innerhalb einer Wachstumsklasse dar. Da für

f, g, h \in ℋ_{0}

mit

f \approx g \approx h

die Beziehung

R (f, h) = R (f, g) \cdot R (g, h)

gilt, kann man durch Auswahl eines Repräsentanten

f_{0}

jeder Funktion

f \in γ (f_{0})

die Zahl

R (f, f_{0})

zuordnen und so alle Funktionen von

γ (f_{0})

anordnen.

Unter Zuhilfenahme von Theorem 3.3 (10) und (11) kann die Aussage von Theorem 3.7 auch elegant zusammengefasst werden:

Lemma 3.8 :
Sei $f, g \in ℋ_{0}$ , $v (f) \neq 0 \neq v (g)$ . Dann gilt:
$\begin{array}{ll} f \approx g & \Leftrightarrow v (f' / f) = v (g' / g) \\ f ≺ g & \Leftrightarrow v (f' / f) > v (g' / g) \end{array}$

Diese Aussage ist inhaltlich vergleichbar mit Theorem 3.7, bietet aber bessere Möglichkeiten für mathematische Beweise durch die Einbeziehung der Ableitung.

Beweis: Benutze den Zusammenhang $(log | f |)' = f' / f$ zusammen mit Theorem 3.3 (10) und (11).

Abschließend noch die formale Einschätzung der Wirkung der Exponential- und Logarithmusfunktion in unserem Wachstumsmodell:

Lemma 3.9 :
Sei $f \in ℋ_{0}$ , $v (f) \neq 0$ , dann gilt:
$γ (log | f |) < γ (f)$

$γ (f) < γ (e^{f})$ , wenn $f \to \pm ∞$ .

$γ (f) > γ (e^{f})$ , wenn $f \to 0$ .

Alle drei Aussagen folgen durch direkte Anwendung von Lemma 3.8 und der Erkenntnisse $v (log | f |) < 0$ im Falle von (1) und $v (f) < 0$ bzw. $> 0$ im Falle von (2) und (3).

Verglichen mit den Beispielen des vorigen Kapitels ergibt sich dieses Bild:

\begin{array}{l} 1 / x ≻ 1 ≺ ln x \approx (ln x)^{10} ≺ x^{0.1} \approx x \\ \approx x ln x \approx x (ln x)^{10} \approx x^{1.1} \approx x^{10} ≺ e^{0.1 x} \approx e^{x} \approx e^{10 x} \end{array}

Betrachten wir noch ein paar Beispiele aus der Welt jenseits von

e^{x}

x \approx x + e^{- x} ≺ e^{- x} \approx e^{x} \approx x + e^{x} \approx e^{x + e^{- x}} ≺ e^{x ln x} ≺ e^{x^{2}} ≺ e^{x + e^{x}}

Interessant anzumerken ist, dass

x + e^{- x} ≺ x + e^{x}

gilt, anderseits aber

e^{- x} \approx e^{x}

. Diese Klassenbildung ist also nicht verträglich mit der Addition.

3.4 Termanalyse

Während wir bisher von Funktionen im mathematischen Sinne ausgegangen sind, betrachten wir nun Funktionen, wie sie von Computeralgebrasystemen gesehen werden: Als rekursive Baumstruktur mit Zahlen, Konstanten und Variablen als Blätter und Operationen als innere Knoten.

Der Algorithmus sieht vor, die am stärksten wachsenden Teilausdrücke durch ω darzustellen. Welche das sind, wird im Folgenden festgelegt. Vorher bezeichnen wir noch mit

SubExp (f)

die Menge aller Teilausdrücke von f, inklusive f selbst. Damit ergibt sich zum Beispiel:

SubExp (5 x^{2} + 7) = {5 x^{2} + 7, 5 x^{2}, 5, x^{2}, x, 2, 7}

Nun kann die Menge der am stärksten wachsenden Teilausdrücke (Most Rapidly Varying, MRV) definiert werden:

Definition 3.10 :(MrvSet)
Sei $f (x)$ eine Funktion in Form einer Baumstruktur. Dann ist $MrvSet (f)$ wie folgt definiert:
$MrvSet (f) : = {g \in SubExp (f) ∣ \forall h \in SubExp (f) : h ⪯ g}$

Wie man an der Definition leicht sieht, sind alle Elemente von

MrvSet (f)

in der gleichen Wachstumsklasse, und kein anderer Teilausdruck von f besitzt ein stärkeres Wachstum.

Da alle Elemente von

MrvSet (f)

in der gleiche Wachstumsklasse liegen, macht es Sinn, solche Mengen und andere Funktionen direkt mit

≺, \approx, ≻

zu vergleichen. Es reicht dabei vollkommen, den Vergleich mit einem Vertreter der Menge durchzuführen.

Als nützlich erweist sich auch eine Hilfsfunktion zur Vereinigung solcher Mengen:

\begin{array}{ll} MrvMax (A, B) = A & , wenn A ≻ B, \\ MrvMax (A, B) = B & , wenn A ≺ B, \\ MrvMax (A, B) = A \cup B & , wenn A \approx B \end{array}

Damit ist der Weg frei für eine konstruktivere Analyse des Wachstums einer Funktion:

Lemma 3.11 :
Ist f eine exp-log Funktion in Baumstruktur, dann gilt:
Wenn $x \notin SubExp (f)$ ist, dann ist $MrvSet (f) = SubExp (f)$ .

Wenn $f = x$ ist, dann ist $MrvSet (f) = {x}$ .

Wenn $f = g \cdot h$ ist, dann ist $MrvMax (MrvSet (g), MrvSet (h)) \subseteq MrvSet (f)$ .

Wenn $f = g + h$ ist, dann ist $MrvMax (MrvSet (g), MrvSet (h)) \subseteq MrvSet (f)$ .

Wenn $f = g^{c} (c \in ℝ)$ ist, dann ist $MrvSet (g) \subseteq MrvSet (f)$ .

Wenn $f = log g$ ist, dann ist $MrvSet (f) = MrvSet (g)$ .

Wenn $f = e^{g}$ und $g \to \pm ∞$ ist, dann ist $MrvSet (f) = MrvMax ({e^{g}}, MrvSet (g))$ .

Wenn $f = e^{g}$ und $g \to c \in ℝ$ ist, dann ist $MrvSet (g) \subseteq MrvSet (f)$ .

In (1) haben alle Teilausdrücke das minimale Wachstum $γ (1)$ . (2) ist offensichtlich.
Bei (3)-(8) ist die Frage entscheidend, ob die jeweilige Operation ein stärkeres Wachstum erzeugen kann, als es die Teilausdrücke einzeln können.
(3) ergibt sich aus Theorem 3.5 (7). (4) erweist sich als schwieriger: So haben im Fall $(- x + e^{- x}) + x$ beide Teile der Summe das Wachstum $γ (x)$ , die Summe jedoch durch Elimination das Wachstum $γ (e^{x})$ . Trotzdem muss das stärkste Wachstum durch einen Teilausdruck von g oder h erzeugt worden sein. (5) folgt aus Theorem 3.5 (3). (6)-(8) folgen im Wesentlichen direkt aus Lemma 3.9, jedoch muss hier zusätzlich bedacht werden, dass g auch in $γ (1)$ liegen kann, wodurch auch der Gesamtausdruck in $γ (1)$ liegt.

In allen obigen Fällen bedeutet

\subseteq

außerdem effektiv, dass höchstens noch der Gesamtausdruck f selbst zusätzlich in der Menge liegen kann. Bei der späteren Umsetzung im Algorithmus kann in diesen Fällen der Gesamtausdruck f ausgelassen werden.

3.5 Ersetzung

Ein wichtiges Thema wurde noch nicht ausreichend betrachtet: Die Ersetzung eines Terms der höchsten Wachstumsklasse durch einen Term, der das Wachstum in der Variablen ω isoliert. Angenommen, ein Term f soll durch einen Term g mit

f \approx g

dargestellt werden. Wie bereits in Kapitel 2.3 dargelegt, wird das Wachstum von Termen künstlich bis auf exponentielles Wachstum angehoben werden. Wie die Implementierung zeigen wird, kann sogar davon ausgegangen werden, dass

f = e^{s}

und

g = e^{t}

ist. Als Ansatz versuchen wir f darzustellen als

f = A \cdot g^{c}

, wobei c konstant und weder 0 noch ∞ sein soll, und A kleineres Wachstum als f und g haben sollte:

A ≺ g

.

Instinktiv scheint es eine gute Idee zu sein, c so zu wählen, dass

v (f) = v (g^{c})

ist - wenn dies denn möglich ist. A ergibt sich dann automatisch als

A = f / g^{c} = e^{s - c t}

.

Wollen wir

A ≺ g

erzwingen, können wir Theorem 3.7 zu Hilfe nehmen:

\begin{array}{ll} A ≺ g & \Leftrightarrow lim_{x \to + ∞} \frac{ln | A |}{ln | g |} = 0 \\ \Leftrightarrow lim_{x \to + ∞} \frac{s - c t}{t} = 0 \\ \Leftrightarrow lim_{x \to + ∞} s / t - c = 0 \\ \Leftrightarrow c = lim_{x \to + ∞} s / t \end{array}

c erweist sich dabei als das bereits bekannte Wachstumsverhältnis:

c = R (f, g)

. Damit ist auch gleich die Existenz von c gesichert, dank Theorem 3.7 angewendet auf

f \approx g

.
Zurück - Inhalt - Übersicht - Vorwärts