Η υπερβατικότητα του π

Εισαγωγή

Έχουμε δει στο παρελθόν ότι ο γνωστός και μη εξαιρετέος αριθμός \pi είναι άρρητος – δείτε εδώ για περισσότερες λεπτομέρειες. Έχουμε δει επίσης ότι κι ένας άλλος αριθμός, εξίσου διάσημος, ο e, είναι κι αυτός άρρητος. Ακόμα παραπέρα, ο περιβόητος e δεν είναι ένας όποιος κι όποιος άρρητος, αλλά ένας υπερβατικός αριθμός – λεπτομέρειες της απόδειξης μπορείτε να βρείτε εδώ. Κι επειδή δεν είμαστε εγκυκλοπαίδειες για θυμόμαστε απ’ έξω τι είναι ένας υπερβατικός αριθμός, ας θυμηθούμε τον ορισμό:

Ένας πραγματικός αριθμός θα λέμε ότι είναι υπερβατικός αν δεν είναι ρίζα κανενός πολυωνύμου με ακέραιους συντελεστές.

Με άλλα λόγια, ένας αριθμός x είναι υπερβατικός αν όσο κι αν προσπαθήσουμε, δεν μπορέσουμε να βρούμε ένα πολυώνυμο με ακέραιους συντελεστές έτσι ώστε να είναι ρίζα του. Σαφώς, αυτό σημαίνει ότι κάθε υπερβατικός αριθμός είναι άρρητος – διότι κάθε ρητός αριθμός είναι ρίζα ενός πρωτοβάθμιου πολυωνύμου με ακέραιους συντελεστές. Επομένως, οι υπερβατικοί είναι, θα έλεγε κανείς, μία κατηγορία αρρήτων με έντονο ταπεραμέντο – αν και αυτό, δεν είναι ακριβώς έτσι, κατ’ ανάγκη.

Όπως μαρτυρά κι ο τίτλος, θα ασχοληθούμε εδώ με την υπερβατικότητα του \pi και θα δείξουμε ότι είναι κι αυτός σαν τον ξάδερφό του τον e.

Μία μεγάλη απόδειξη…

…κι ένα μεγάλο δίλημμα. Ν-λημμα, για την ακρίβεια, θα έλεγε κανείς, αφού έχουμε πάνω από δύο επιλογές στη διάθεσή μας – κακό μαθηματικό χιούμορ. Υπάρχουν πολλές αποδείξεις για την υπερβατικότητα του \pi ωστόσο όλες τους είναι τεράστιες. Δεν είναι, βέβαια, ότι μας τρομάζουν οι μεγάλες αποδείξεις – άλλωστε, αυτή είναι η δουλειά ενός μαθηματικού – αλλά, οι περισσότερες αποδείξεις που κυκλοφορούν ελεύθερες εκεί έξω είναι τόσο μεγάλες που δεν μπορεί κανείς εύκολα να συγκρατήσει τις βασικές τους ιδέες.

Η παραδοσιακή απόδειξη της υπερβατικότητας του \pi βασίζεται στο θεώρημα των Weierstrass-Lindemann και είναι αρκετά απλή – δεδομένου του θεωρήματος. Ωστόσο, όλο το ζουμί της απόδειξης και της διαίσθησης βρίσκεται, σαφώς, στην απόδειξη του ίδιου του θεωρήματος – που, όπως φαντάζεστε, δεν είναι εύκολη υπόθεση. Επίσης, το εν λόγω θεώρημα αποδεικνύει κάτι πολύ γενικότερο από αυτό που εμείς θέλουμε να αποδείξουμε, οπότε θα μας ανάγκαζε να κολυμπήσουμε σε πολύ πιο βαθιά νερά από αυτά που αυτή τη στιγμή θέλουμε.

Μία άλλη μέθοδος με την οποία μπορούμε να προσεγγίσουμε το πρόβλημά μας είναι να χρησιμοποιήσουμε p-αδικούς αριθμούς. Συνοπτικά, εκτός από τη συνήθη δεκαδική αναπαράσταση ενός ρητού αριθμού, μπορούμε να χρησιμοποιήσουμε – λίγο πιο περίτεχνα – και άλλες βάσεις αρίθμησης – απλά, όχι με τον τρόπο που φαντάζεστε. Ας πάρουμε, για παράδειγμα, τον ρητό αριθμό \dfrac{1}{5} και ας θεωρήσουμε τον πρώτο αριθμό p=7 – η σημασία του να είναι πρώτος ο p θα φανεί παρακάτω. Το \dfrac{1}{5} μπορούμε να το γράψουμε στο δεκαδικό σύστημα ως εξής:

\displaystyle\frac{1}{5}=\frac{2}{10}=2\cdot\frac{1}{10}+0\frac{1}{100}+0\frac{1}{1000}+\dots.

Γενικά, κάθε αριθμός μπορεί να γραφεί στο δεκαδικό σύστημα στη μορφή:

\displaystyle\sum_{k=0}^NA_k10^k+\sum_{k=1}^\infty a_k10^{-k},\ A_k,a_k\in\{0,1,\ldots,9\}.

Ανάλογα, κάθε αριθμός μπορεί να γραφεί και στη μορφή:

\displaystyle\sum_{k=0}^NA_kp^k+\sum_{k=1}^\infty a_kp^{-k},\ A_k,a_k\in\{0,1,\ldots,p-1\},

όπου p είναι κάποιος πρώτος αριθμός. Η αλήθεια είναι ότι η μοναδικότητα του παραπάνω αναπτύγματος χρειάζεται μία εξήγηση, όπως επίσης και το γεγονός ότι στην παραπάνω περίπτωση δεν έχουμε την ίδια έννοια σύγκλισης που έχουμε και στους πραγματικούς αριθμούς – αντιθέτως, χρησιμοποιούμε μία άλλη έννοια απόλυτης τιμής για να μιλήσουμε για την παραπάνω σειρά. Όλα αυτά, μαζί με το γεγονός ότι η απόδειξη που βασίζεται σε τέτοιου είδους αριθμούς, ε, δεν είναι και ιδιαίτερα μικρή και χαριτωμένη, μας αποθαρρύνει και από αυτήν την κατεύθυνση.

Τέλος, μία άλλη γραμμή από την οποία μπορούμε να επιτεθούμε στο πρόβλημά μας είναι αυτή που περνάει από τα χωράφια των μιγαδικών αριθμών. Η αλήθεια είναι ότι κι εδώ πρέπει να εξηγήσουμε κάποια πράγματα – όπως, αρχικά, τι είναι οι μιγαδικοί αριθμοί – αλλά, σε αντίθεση με τις προηγούμενες αποδείξεις, έχουμε δύο σημαντικά πλεονεκτήματα:

  1. Δεν είναι τόσο πολύπλοκες οι έννοιες που απαιτείται να εξηγήσουμε.
  2. Δεν είναι τόσο πολύπλοκες οι πράξεις που πρέπει να κάνουμε.

Σε διδακτικό επίπεδο, οι αποδείξεις που από το πουθενά εμφανίζουν μιγαδικούς αριθμούς πάντοτε μου άρεσαν, γιατί αναδεικνύουν πόσο χρήσιμο εργαλείο είναι οι μιγαδικοί αριθμοί. Για την ακρίβεια, δρουν, κατά κάποιον τρόπο, σαν καταλύτης σε πολλές αποδείξεις και τις κάνουν συντομότερες και κομψότερες – μη γελιέστε, πάλι με ολοκληρώματα θα μπλέξουμε, απλά θα είναι κάπως πιο μικρά.

Ένα ακόμα στοιχείο που μας ωθεί προς τα χωράφια των μιγαδικών είναι οι έννοιες που έχουμε να χειριστούμε. Θέλουμε, όπως είπαμε, να αποδείξουμε ότι ο \pi δεν είναι αλγεβρικός. Με άλλα λόγια, θέλουμε να αποδείξουμε ότι δεν είναι ρίζα ενός πολυωνύμου με ακεραίους συντελεστές. Ε, αφού μπλεκόμαστε με πολυώνυμα και ρίζες, γιατί να μην βάλουμε και τους μιγαδικούς αριθμούς στο παιχνίδι; Άλλωστε, στο σύμπαν των μιγαδικών αριθμών, όλα τα πολυώνυμα έχουν ρίζες, άρα πολλά πράγματα αναμένουμε να είναι πιο εύκολα.

Επομένως, προτού δούμε την απόδειξή μας, ας δούμε κάποια πράγματα για τους μιγαδικούς αριθμούς και τα πολυώνυμα.

Τι είναι οι Μιγαδικοί Αριθμοί;

Αριθμοί – κυνική απάντηση.
Ενδιαφέροντες – ενθουσιώδης απάντηση.
Περίπλοκοι – πεσιμιστική απάντηση.

Μπορούμε να συνεχίσουμε έτσι για ώρες, αλλά ας περάσουμε στο ζουμί της υπόθεσης. Ιστορικά οι μιγαδικοί γεννιούνται με έναν περίπλοκο τρόπο που περνάει μέσα από πολυώνυμα τρίτου βαθμού, μαθηματικές μονομαχίες μεταξύ καθηγητών (και μη) πανεπιστημίων και πολλές περιπέτειες. Ωστόσο, όλα αυτά – αν και αρκετά spicy – μπορούν να συνοψιστούν στην ακόλουθη ερώτηση:

Γιατί να μην έχει λύση η εξίσωση x^2+1=0;

Χαζή ερώτηση, θα έλεγε κανείς, βιαστικά. Μα, γιατί προφανώς ισχύει ότι x^2\geq0, είναι η πρώτη απάντηση που έρχεται στο μυαλό. «Ναι, αλλά γιατί ισχύει ότι x^2\geq0;», θα έλεγε κανείς, αν ήθελε να κάνει τον δικηγόρο του διαβόλου.

Χμμμ…

Αν το καλοσκεφτούμε, η ιδιότητα x^2\geq0 έπεται από τον τρόπο που σχετίζεται ο πολλαπλασιασμός μεταξύ πραγματικών αριθμών με τη σχέση διάταξης που έχουμε ορίσει στο \mathbb{R} – μπορείτε να θυμηθείτε από εδώ τα βασικά αξιώματα των πραγματικών αριθμών. Για την ακρίβεια, το ότι x^2\geq0 είναι άμεσο πόρισμα του πολύ ισχυρότερου συμπεράσματος ότι το γινόμενο δύο ομόσημων πραγματικών αριθμών είναι θετικό. Το τελευταίο, αποδεικνύεται χρησιμοποιώντας τόσο κάποια από τα αλγεβρικά αξιώματα των πραγματικών αριθμών όσο και τα αξιώματα της διάταξης.

Όλα αυτά, αν κάνουμε ένα βήμα πίσω, μας οδηγούν στο εξής συμπέρασμα:

Το επιχείρημα «Επειδή x^2\geq0   η εξίσωση x^2+1=0   δεν έχει πραγματικές λύσεις» δεν έχει αμιγώς αλγεβρικό χαρακτήρα.

Πράγματι, όπως είδαμε παραπάνω – και όπως φαίνεται και από το ίδιο το επιχείρημα, άλλωστε – επικαλούμαστε μία «εξω-αλγεβρική» ιδιότητα των πραγματικών αριθμών, που έχει να κάνει με τη διάταξή τους και όχι μόνο με το πώς ορίζονται και σχετίζονται οι πράξεις μεταξύ τους. Ωστόσο, οι πολυωνυμικές εξισώσεις δεν έχουν, από τη φύση τους, καμία σχέση με όποια σχέση διάταξης, καθώς είναι αμιγώς αλγεβρικά αντικείμενα.

Επομένως, επιστρέφουμε με λίγες παραπάνω σκέψεις στην όχι και τόσο χαζή τελικά ερώτηση που διατυπώσαμε αρχικά – προσθέτοντας μία διευκρίνιση:

Γιατί να μην έχει λύση η εξίσωση x^2+1=0; – δεκτά γίνονται μόνο αλγεβρικά επιχειρήματα.

Με την παραπάνω διευκρίνιση, είναι σαφές ότι δεν μπορούμε να δώσουμε πειστική απάντηση. Όσο κι αν το προσπαθήσουμε, η ύπαρξη λύσης της παραπάνω εξίσωσης – όχι, σαφώς, πραγματικής – δεν παραβιάζει καμία αλγεβρική νομιμότητα. Μόνο αν βάλουμε στο παιχνίδι και την έννοια της συνήθους διάταξης των πραγματικών αριθμών μπορούμε να πούμε ότι έχουμε πρόβλημα. Αλλά, αυτό απλά σημαίνει ότι, εντάξει, τι να κάνουμε, δε θα είναι πραγματικός αριθμός η λύση της εξίσωσης αυτής.

Ας ονομάσουμε, λοιπόν, μία λύση αυτής της εξίσωσης i. Τότε, θα έχουμε:

i^2+1=0\Leftrightarrow i^2=-1.

Τώρα, όπως είπαμε και παραπάνω, το i δε θα είναι ένας πραγματικός αριθμός, άρα το σύνολο C=\mathbb{R}\cup\{i\} δε θα είναι το σύνολο των πραγματικών αριθμών. Αντιθέτως, θα είναι ένα γνήσιο υπερσύνολό τους. Ας παρατηρήσουμε, επίσης, ότι το εν λόγω i που «δημιουργήσαμε» παραπάνω, μπορούμε να το χρησιμοποιήσουμε σε διάφορες πράξεις με άλλους πραγματικούς αριθμούς, καθώς, όπως είπαμε – ίσως λίγο χαλαρά – είναι μία αλγεβρική οντότητα και άρα μπορεί να «συναναστραφεί» με τους υπόλοιπους πραγματικούς αριθμούς. Έτσι, μπορούμε να μιλήσουμε για πράγματα όπως τα ακόλουθα:

1+i,\ 2-3i,\ 3\sqrt{2}-5i^3.

Σαφώς, μπορούμε και με τους παραπάνω αριθμούς που μόλις αναφέραμε να κάνουμε πράξεις κ.ο.κ. καθώς κι αυτοί με τη σειρά τους είναι απλές αλγεβρικές οντότητες. Μπορούμε, έτσι, να ορίσουμε το σύνολο \mathbb{C} που θα αποτελείται από όλα τα γινόμενα, αθροίσματα, διαφορές, πηλίκα κ.λπ. όλων των στοιχείων του συνόλου C μεταξύ τους (όσες φορές θέλουμε). Αυτό το σύνολο θα το ονομάζουμε το σύνολο των μιγαδικών αριθμών και θα αποτελέσει ένα πολύ χρήσιμο εργαλείο στην πορεία.

Όμως, πώς μοιάζουν οι μιγαδικοί αριθμοί; Αρχικά, να πούμε ότι, όπως ίσως φαντάζεστε, δεν μπορούμε να ορίσουμε κάποια «κομψή» σχέση διάταξης στους μιγαδικούς αριθμούς η οποία να επεκτείνει τη σχέση διάταξης που έχουμε στους πραγματικούς αριθμούς. Αλλά, στο τέλος της ημέρας, δε θα μας χρειαστεί για όσα θα πούμε παρακάτω, οπότε, σιγά τ’ αυγά. Ένα άλλο σημαντικό στοιχείο που αφορά τους μιγαδικούς και θα είναι χρήσιμο είναι ότι κάθε μιγαδικός αριθμός μπορεί, εν τέλει, να γραφτεί στην ακόλουθη πολύ απλή μορφή:

x+iy,\ x,y\in\mathbb{R}.

Τόσο απλά. Το x θα το λέμε το πραγματικό μέρος του αριθμού x+iy και το y το φανταστικό μέρος του – δε θα μπούμε σε λεπτομέρειες για το πώς αυτό μπορεί να αποδειχθεί αυτήν τη στιγμή εδώ, ίσως στο μέλλον. Επίσης, ένα κομβικής σημασίας αποτέλεσμα που ισχύει για πολυώνυμα με μιγαδικούς συντελεστές και μεταβλητές και θα χρειαστούμε παρακάτω είναι το λεγόμενο Θεμελιώδες Θεώρημα της Άλγεβρας, το οποίο μας λέει το εξής:

Αν p(x)  είναι ένα πολυώνυμο βαθμού n=1,2,\ldots  με μιγαδικούς συντελεστές, τότε μπορεί να γραφεί στη μορφή p(x)=a(x-r_1)(x-r_2)\dots(x-r_n),  όπου a,r_1,r_2,\ldots,r_n  είναι μιγαδικοί αριθμοί – όχι, κατ’ ανάγκη διακεκριμένοι μεταξύ τους.

Ωραίο αυτό, είναι η αλήθεια, καθώς το παραπάνω θεώρημα μας δίνει έναν ωραίο καθολικό τρόπο να γράφουμε κάθε πολυώνυμο με μιγαδικούς συντελεστές – σαφώς, δε γίνεται καμία αναφορά στο ποιες είναι αυτές οι ρίζες, αλλά ούτε αυτό θα μας πολυαπασχολήσει στα επόμενα.

Επίσης, να πούμε ότι για κάθε μιγαδικό αριθμό μπορούμε να ορίσουμε και μία απόλυτη τιμή, απλώς όχι με τον τρόπο που το κάνουμε για τους πραγματικούς. Για την ακρίβεια, αν x+iy είναι ένας μιγαδικός αριθμός, τότε η απόλυτη τιμή του ορίζεται να είναι η ακόλουθη παράσταση:

|x+iy|=\sqrt{x^2+y^2}.

Μπορούμε να αποδείξουμε ότι η παραπάνω ποσότητα συμπεριφέρεται στις πράξεις με τον ίδιο τρόπο που συμπεριφέρεται και η απόλυτη τιμή των πραγματικών αριθμών, επομένως μπορούμε άφοβα να εφαρμόζουμε όλες τις παραδοσιακές ιδιότητες της απόλυτης τιμής – και, ειδικότερα, την τριγωνική ανισότητα.

Έχοντας, τώρα, τα βασικά μας εφόδια για τους μιγαδικούς αριθμούς, μπορούμε να προχωρήσουμε κάποια βήματα πιο κοντά στην απόδειξή μας.

Συμμετρικά πολυώνυμα

Χα, την πατήσατε! Έχουμε ακόμα μία έννοια που πρέπει να παρουσιάσουμε πριν παρουσιάσουμε την απόδειξή μας. Το επόμενο μαθηματικό ον που θα χρειαστούμε είναι τα συμμετρικά πολυώνυμα. Γενικά, η έννοια του πολυωνύμου μας είναι γνωστή από το σχολείο – από το γυμνάσιο, κιόλας. Αυτό που ίσως δεν έχουμε συνηθίσει να βλέπουμε στο σχολείο είναι πολυώνυμα πολλών μεταβλητών. Ένα τέτοιο πολυώνυμο είναι, όπως ίσως φαντάζεστε, ένα πολυώνυμο που δεν έχει μόνο μία μεταβλητή, αλλά περισσότερες – πεπερασμένες στο πλήθος, σαφώς. Για παράδειγμα, το παρακάτω είναι ένα πολυώνυμο τριών μεταβλητών:

p(x_1,x_2,x_3)=2x_1x_2^2+4x_2^3x_3-\sqrt{2}x_1x_2^2x_3^7.

Επιλέξαμε να βάλουμε δείκτες στις μεταβλητές αντί να χρησιμοποιήσουμε διαφορετικά γράμματα κυρίως γιατί θα μας διευκολύνει παρακάτω. Όπως θα θυμάστε, στο σχολείο συνηθίζαμε τα πολυώνυμα να τα γράφουμε ξεκινώντας με το μονώνυμο μεγαλύτερου βαθμού και παραθέτοντας τα υπόλοιπα με φθίνουσα σειρά – ως προς τον βαθμό τους. Εδώ, όμως, έχουμε πολλές μεταβλητές και άρα δεν είναι τόσο εύκολο να καταλήξουμε στο ποιο μονώνυμο «προηγείται». Ένας απλός τρόπος να το διευθετήσουμε αυτό είναι να θυγατροθετήσουμε μία λεξικογραφική προσέγγιση. Θα παραθέτουμε τους όρους σε ένα πολυώνυμο πολλών μεταβλητών έτσι ώστε πρώτα να βρίσκεται το μονώνυμο με τον μεγαλύτερο βαθμό ως προς x_1 και, σε περίπτωση που υπάρχουν περισσότερα του ενός, θα προηγείται αυτό που έχει τον μεγαλύτερο βαθμό της μεταβλητής x_2. Αν και πάλι έχουμε περισσότερα από ένα τέτοια μονώνυμα, θα εξετάζουμε τη μεταβλητή x_3 κ.ο.κ. Έτσι, το παραπάνω πολυώνυμο γράφεται λεξικογραφικά ως εξής:

p(x_1,x_2,x_3)=-\sqrt{2}x_1x_2^2x_3^7+2x_1x_2^2+4x_2^3x_3.

Έτσι βρήκαμε έναν ενιαίο τρόπο να γράφουμε όλα τα πολυώνυμα πολλών μεταβλητών εν τάξει – πολύ ευχάριστο αυτό. Τώρα, από όλα τα πολυώνυμα πολλών μεταβλητών, ιδιαίτερα ενδιαφέροντα είναι εκείνα που παρουσιάζουν μία συμμετρία, με την ακόλουθη έννοια – θα εξηγηθούμε αμέσως μετά την ακόλουθη μωβ παρένθεση:

Ένα πολυώνυμο πολλών μεταβλητών θα λέγεται συμμετρικό αν παραμένει αναλλοίωτο από κάθε μετάθεση των μεταβλητών του.

Με άλλα λόγια, ένα πολυώνυμο είναι συμμετρικό αν για να υπολογίσει κανείς την τιμή του δεν παίζουν ρόλο τα ονόματα των μεταβλητών. Για παράδειγμα, το παραπάνω πολυώνυμο δεν είναι συμμετρικό καθώς αν ανακατέψουμε τις τρεις μεταβλητές του ως εξής:

x_1\to x_2,\ x_2\to x_1,\ x_3\to x_3,

τότε παίρνουμε το εξής πολυώνυμο:

q(x_1,x_2,x_3)=p(x_2,x_1,x_3)=4x_1^3x_3-\sqrt{2}x_1^2x_2x_3^7+2x_1^2x_2.

Εδώ, σαφώς q\neq p αφού, για παράδειγμα, q(1,0,1)=4\neq0=p(1,0,1). Το ακόλουθο πολυώνυμο, όμως, είναι συμμετρικό:

p(x_1,x_2,x_3)=x_1^2x_2+x_1^2x_3+x_1x_2^2+x_1x_3^2+x_2^2x_3+x_2x_3^2+7.

Πράγματι, όποια εναλλαγή κι αν επιχειρήσουμε να κάνουμε ανάμεσα στις μεταβλητές του p θα δούμε ότι τελικά παίρνουμε το ίδιο πολυώνυμο – δοκιμάστε να παίξετε λίγο και θα το δείτε. Τώρα, κι από τα συμμετρικά πολυώνυμα δε μας νοιάζουν όλα, για αρχή. Θα ασχοληθούμε λίγο με εκείνα τα συμμετρικά πολυώνυμα που έχουν την ακόλουθη απλή δομή – τόσο απλή, που τα αποκαλούμε στοιχειώδη:

Ένα συμμετρικό πολυώνυμο αποκαλείται στοιχειώδες (συμμετρικό πολυώνυμο) όταν αποτελείται από τις μεταθέσεις ενός μόνο μονωνύμου του οποίου οι μεταβλητές έχουν βαθμό το πολύ 1.

Έτσι, το παραπάνω συμμετρικό πολυώνυμο δεν είναι στοιχειώδες καθώς περιέχει και μονώνυμα με τετραγωνικούς όρους, ενώ το παρακάτω είναι ένα στοιχειώδες συμμετρικό πολυώνυμο:

q(x_1,x_2,x_3)=x_1x_2+x_1x_3+x_2x_3.

Πράγματι, αφενός είναι συμμετρικό αφού περιέχει όλες τις δυνατές μεταθέσεις του μονωνύμου x_1x_2 – δηλαδή, όλες τα δυνατά γινόμενα που μπορούμε να φτιάξουμε με τις μεταβλητές x_1,x_2,x_3 – ενώ από την άλλη καμία μεταβλητή δεν εμφανίζεται πουθενά με εκθέτη μεγαλύτερο της μονάδας. Τώρα, τα στοιχειώδη συμμετρικά πολυώνυμα θα παίξουν έναν σημαντικό ρόλο στην οικονομία της γραφής των συμμετρικών πολυωνύμων, γενικότερα – άλλωστε, πάντα σχεδόν εκεί μας εξυπηρετούν οι στοιχειώδεις οντότητες στα μαθηματικά. Αλλά αυτό θα το συζητήσουμε σε λίγο. Προς το παρόν θα απαριθμήσουμε και θα «τακτοποιήσουμε» τα στοιχειώδη συμμετρικά πολυώνυμα. Αρχικά, έστω n μεταβλητές, x_1,x_2,\ldots,x_n. Πόσα στοιχειώδη συμμετρικά πολυώνυμα μπορούμε να φτιάξουμε με αυτές;

Χμμμ… Η απάντηση είναι σχετικά απλή, αν κοιτάξουμε τον ορισμό. Κάθε στοιχειώδες συμμετρικό πολυώνυμο αποτελείται από όλες τις μεταθέσεις ενός μονωνύμου στο οποίο οι μεταβλητές όλες εμφανίζονται το πολύ μία φορά – άρα ή μία ή καμία. Τώρα, αυτά τα μονώνυμα είναι τόσα ακριβώς όσα και οι αριθμοί από το 0 έως το n καθώς αν δύο «στοιχειώδη» μονώνυμα έχουν το ίδιο πλήθος μεταβλητών με εκθέτη 1 τότε επάγουν το ίδιο στοιχειώδες συμμετρικό πολυώνυμο. Άρα, έχουμε συνολικά n+1 στοιχειώδη συμμετρικά πολυώνυμα με n μεταβλητές.

Επειδή, τώρα, στα μαθηματικά κάνουμε τα εύκολα δύσκολα, ας δούμε λίγο με ένα παράδειγμα πώς προκύπτει το παραπάνω. Ας πάρουμε, για παράδειγμα, τέσσερις μεταβλητές, έστω x_1,x_2,x_3,x_4. Τότε τα στοιχειώδη συμμετρικά πολυώνυμα που μπορούμε να κατασκευάσουμε είναι τα εξής:

  • \sigma_{4,0}=1 – οποιοδήποτε σταθερό θα μας έκανε, αλλά επιλέξαμε τη μονάδα για λόγους ομοιομορφίας και ψυχαναγκασμού.
  • \sigma_{4,1}=x_1+x_2+x_3+x_4 – το στοιχειώδες μονώνυμο που χρησιμοποιούμε έχει βαθμό 1.
  • \sigma_{4,2}=x_1x_2+x_1x_3+x_1x_4+x_2x_3+x_2x_4+x_3x_4 – το στοιχειώδες μονώνυμο έχει βαθμό 2.
  • \sigma_{4,3}=x_1x_2x_3+x_1x_2x_4+x_1x_3x_4+x_2x_3x_4 – το στοιχειώδες μονώνυμο έχει βαθμό 3.
  • \sigma_{4,4}=x_1x_2x_3x_4 – το στοιχειώδες μονώνυμο έχει βαθμό 4.

Αυτά είναι όλα κι όλα πέντε – δηλαδή 4+1, όπως είχαμε υπολογίσει παραπάνω. Παρατηρήστε ότι παραπάνω έχουμε επιλέξει να γράφουμε απλά \sigma_{n,k} αντί για \sigma_{n,k}(x_1,x_2,x_3,x_4) κυρίως για λόγους απλότητας στον συμβολισμό. Επίσης, από εδώ και στο εξής τα n+1 στο πλήθος στοιχειώδη συμμετρικά πολυώνυμα n μεταβλητών θα τα συμβολίζουμε με:

\sigma_{n,0},\sigma_{n,1},\ldots,\sigma_{n,n},

όπου ο πρώτος δείκτης αντιστοιχεί στο πλήθος των μεταβλητών και ο δεύτερος στο πλήθος των μεταβλητών μη μηδενικού βαθμού σε κάθε όρο του πολυωνύμου.

Έτσι καταφέραμε και βάλαμε τάξη στα στοιχειώδη συμμετρικά πολυώνυμα – μία τάξη που θα μας βοηθήσει να βάλουμε τάξη και γενικότερα στα συμμετρικά πολυώνυμα, οσονούπω…

Πολυώνυμα και μιγαδικοί

Καιρός να τα μπλέξουμε όλα τώρα. Πριν δούμε την απόδειξη, όπως υποσχεθήκαμε παραπάνω, δεν έχουμε να δούμε καινούργιες έννοιες, έχουμε ωστόσο να μπλέξουμε τις έννοιες που παρουσιάσαμε ως τώρα μεταξύ τους. Αρχικά, να θυμίσουμε ότι, κάθε πολυώνυμο με μιγαδικούς συντελεστές και μιγαδικές μεταβλητές – το δεύτερο είναι το hot – που έχει βαθμό n\geq1 μπορεί να γραφτεί στην ακόλουθη μορφή:

\displaystyle p(x)=c(x-\rho_1)(x-\rho_2)\dots(x-\rho_n)=c\prod_{k=1}^n(x-\rho_k),

όπου το σύμβολο \displaystyle \prod, αν δεν το έχετε ξαναδεί, είναι μία απλή συντομογραφία για το γινόμενο. Τώρα, η παραπάνω μορφή μας προκαλεί να κάνουμε όλες τις επιμεριστικές που βλέπουμε μπροστά μας έτσι ώστε να γράψουμε το πολυώνυμο στη σχολική του μορφή:

p(x)=a_nx^n+a_{n-1}x^{n-1}+\dots+a_1x+a_0,

για κατάλληλους συντελεστές. Ωστόσο, αυτό απαιτεί λίγη δουλειά από μέρους μας. Βασικά, δεν είναι και τόσο δύσκολο, καθώς, για να βρούμε τα αποτελέσματα των διάφορων επιμεριστικών αρκεί (και πρέπει) να καταγράψουμε όλους τους συνδυασμούς που μπορούμε να κάνουμε με τις παραπάνω παρενθέσεις. Όπου, ως συνδυασμούς εννοούμε τις επιλογές ανάμεσα σε x και \rho_k που έχουμε να κάνουμε από κάθε παρένθεση. Ας πάμε, λοιπόν, όρο προς όρο:

  • Για τον συντελεστή a_n του x^n πρέπει να επιλέξουμε από κάθε παρένθεση τα x καθώς με κάθε άλλον συνδυασμό θα παίρναμε ένα τελικό γινόμενο με βαθμό ως προς x μικρότερο του n. Επομένως, ο συντελεστής του x^n είναι η σταθερά c που έχουμε αφήσει έξω από το κυρίως γινόμενο ή, για να το γράψουμε λίγο καλύτερα, a_n=c\cdot1 – θα δείτε σε λίγο γιατί βάλαμε το 1 εκεί δίπλα.
  • Για τον συντελεστή a_{n-1} του x^{n-1} πρέπει να επιλέγουμε συνδυασμούς έτσι ώστε μονό από μία παρένθεση να μην έχουμε επιλέξει το x. Αυτοί οι συνδυασμοί είναι ακριβώς n στο πλήθος και μας δίνουν το άθροισμα όλων των ριζών του πολυωνύμου, οπότε: a_{n-1}=-c(\rho_1+\rho_2+\dots+\rho_n).
  • Αναλόγως, για να επιτύχουμε βαθμό n-2 θα πρέπει να επιλέγουμε από δύο παρενθέσεις τις ρίζες κι από κάθε άλλη το x, οπότε και θα πάρουμε το άθροισμα όλων των ανά δύο γινομένων των ριζών του p. Έτσι, έχουμε: a_{n-2}=c(\rho_1\rho_2+\rho_1\rho_3+\dots+\rho_{n-1}\rho_n).

Με ανάλογο τρόπο βρίσκουμε τον ακόλουθο τύπο για τους συντελεστές του p:

\displaystyle a_{n-k}=(-1)^{k}c\sum_{1\leq i_1<\dots<i_k\leq n}\rho_{i_1}\dots\rho_{i_k}.

Κακάσχημο! Αλλά, δεν πειράζει, γιατί αν είμαστε λίγο γάτες θα παρατηρήσουμε ότι στους παραπάνω τύπους – που, παρεμπιπτόντως, τους λέμε τύπους του Vieta – εμφανίζονται τα αξιολάτρευτα στοιχειώδη συμμετρικά πολυώνυμα που είδαμε παραπάνω. Για την ακρίβεια, ο παραπάνω τύπος μπορεί να γραφτεί πολύ απλούστερα ως εξής:

a_{n-k}=(-1)^{k}c\sigma_{n,n-k}(\rho_1,\dots,\rho_n).

Έτσι, κάθε πολυώνυμο μπορεί να γραφτεί συναρτήσει των – μιγαδικών – ριζών του ως εξής:

\displaystyle p(x)=c\sum_{k=0}^n(-1)^{k}\sigma_{n,n-k}(\rho_1,\ldots,\rho_n)x^k.

Δεν είναι όμως μόνο αυτή η περίπτωση που τα στοιχειώδη συμμετρικά πολυώνυμα μπορούν να μας φανούν χρήσιμα. Για κάθε συμμετρικό πολυώνυμο n μεταβλητών ισχύει το ακόλουθο εξαιρετικό αποτέλεσμα, γνωστό και ως θεμελιώδες θεώρημα των συμμετρικών πολυωνύμων:

Αν p είναι ένα συμμετρικό πολυώνυμο n μεταβλητών (με ακέραιους συντελεστές), τότε υπάρχει ένα πολυώνυμο q,\ n μεταβλητών (με ακέραιους συντελεστές) έτσι ώστε p=q(\sigma_{n,1},\sigma_{n,2},\ldots,\sigma_{n,n}).

Με άλλα λόγια, κάθε συμμετρικό πολυώνυμο μπορεί να εκφραστεί μέσα από αθροίσματα και γινόμενα στοιχειωδών συμμετρικών πολυωνύμων. Αυτό το αποτέλεσμα θα μας φανεί ιδιαίτερα εξυπηρετικό στην πορεία της απόδειξής μας. Να επισημάνουμε εδώ ότι δεν έχει τόση σημασία για το θεώρημα το ίδιο ότι οι συντελεστές των πολυωνύμων είναι ακέραιοι, καθώς ισχύει γενικά, για κάθε μεταθετικό δακτύλιο με μονάδα αυτό – τώρα, το τι είναι ένας τέτοιος δακτύλιος μπορείτε να το βρείτε εδώ. Ωστόσο, εμάς θα μας απασχολήσουν κυρίως τέτοια πολυώνυμα, οπότε και δε μας νοιάζει κάποια πολύ γενικότερη διατύπωση.

Η απόδειξη

Καιρός ήταν, μετά από τόσες εισαγωγές, να φτάσουμε και στην ουσία της απόδειξής μας – την ίδια την απόδειξη. Η απόδειξη θα ακολουθήσει σε έναν μεγάλο βαθμό την φιλοσοφία της απόδειξης της υπερβατικότητας του e που έχουμε δει εδώ αλλά και αυτήν της αρρητότητας του \pi που έχουμε δει εδώ. Για να θυμίσουμε λίγο τη λογική, αμφότερες οι αποδείξεις, όπως αναμενόταν, προχωρούν με απαγωγή σε άτοπο. Αρχικά αποδεικνύαμε με κάποιον αλγεβρικό τρόπο ότι κάποιο πολυώνυμο του \pi παίρνει ακέραιες τιμές σε κάποιες συγκεκριμένες περιπτώσεις και στη συνέχεια, κάπως – συνήθως μέσα από ολοκληρώματα και ολοκλήρωση κατά παράγοντες – καταλήγαμε στο ότι παίρνει και τιμές αυθαίρετα κοντά στο μηδέν ή, εν πάσει περιπτώσει, όχι ακέραιες. Ε, κάτι ανάλογο θα κάνουμε και σε αύτην την περιπτωση, χρησιμοποιώντας τα εργαλεία που έχουμε παρουσιάσει ως τώρα. Για την ακρίβεια, αρχικά θα αποδείξουμε κάποια αποτελέσματα που έχουν αναλυτικό χαρακτήρα και μας οδηγούν στο συμπέρασμα ότι μία δεδομένη έκφραση παίρνει και μη ακέραιες τιμές. Στη συνέχεια, θα αποδείξουμε ότι η ίδια έκφραση παίρνει αποκλειστικά ακέραιες τιμές κι έτσι θα καταλήξουμε σε αντίφαση – όπως το υποσχεθήκαμε.

Αυτή η τεχνική έχει ένα ιδιαίτερο ενδιαφέρον και αποδεικνύει συνάμα και κάτι που διαφοροποιεί τους υπερβατικούς αριθμούς από τους υπόλοιπους άρρητους – τουλάχιστον κάποιους από αυτούς. Αν και το να μην είναι ένας αριθμός ρητός είναι από μόνο του μία εν γένει αλγεβρική ιδιότητα – υπό την έννοια ότι οι ρητοί μπορούν να καθοριστούν πλήρως αλγεβρικά, άρα και οι άρρητοι ως οι μη ρητοί – το υποσύνολο των αρρήτων που αποκαλούμε υπερβατικούς έχει έναν έντονο αναλυτικό χαρακτήρα. Έτσι, μόνο αλγεβρικά επιχειρήματα δεν επαρκούν για να καταλήξουμε σε αντιφάσεις ως προς το αν είναι ή όχι ρίζες πολυωνύμων με ακεραίους συντελεστές – αλγεβρικοί, δηλαδή – αλλά απαιτείται να επικαλεστούμε και κάποια ιδιαίτερη αναλυτική τους ιδιότητα – όπως έγινε με την απόδειξη της υπερβατικότητας του e και θα γίνει ξανά με αυτήν του \pi.

Η απόδειξη που θα παρουσιάσουμε είναι μία παραλλαγή της απόδειξης του Niven, όπως περίπου παρουσιάζεται στο: Formal Proofs of Transedence of e an \pi as an Application of Multivariate and Symmetric Polynomials, Sophie Bernard, Yves Bertot, Laurence Rideau, Pierre-Yves Strub, arXiv:1512.02791v1 [cs.LO] 9 Dec 2015.

Αναλυτικό μέρος

Όλο το αναλυτικό μέρος της απόδειξής μας βασίζεται σε μία οικογένεια μιγαδικών ολοκληρωμάτων. Αν και ακούγεται τρομακτικός ο όρος «μιγαδικό ολοκλήρωμα», στα πλαίσια που θα μας απασχολήσει εδώ δεν είναι. Γενικά, αν f είναι μία συνάρτηση που παίρνει μιγαδικές τιμές τότε μπορούμε πάντα να τη γράψουμε στη μορφή:

f=u+iv,

όπου u,v είναι δύο συναρτήσεις που παίρνουν πραγματικές τιμές – αυτό έπεται άμεσα από τη γραμή κάθε μιγαδικού αριθμού σε x+iy με x,y πραγματικούς. Έτσι, ορίζουμε και το ολοκλήρωμα αυτής της συνάρτησης κατά φυσιολογικό τρόπο ως εξής:

\displaystyle\int f(x)dx=\int u(x)dx+i\int v(x)dx.

Με τον παραπάνω ορισμό είναι εύκολο να αποδείξουμε όλες τις αγαπημένες αλγεβρικές ιδιότητες του ολοκληρώματος, τις οποίες και θα χρησιμοποιούμε χωρίς να χολοσκάμε ιδιαιτέρως. Τώρα, ορίζουμε την ακόλουθη οικογένεια ολοκληρωμάτων για ένα μιγαδικό πολυώνυμο p(x):

\displaystyle I_p(a)=\int_0^1ae^{-ax}p(ax)dx.

Αυτά τα ολοκληρώματα έχουν κάποιες πολύ καλές ιδιότητες, όπως θα δούμε σιγά-σιγά. Αρχικά, αν ορίσουμε, για τη δική μας ευκολία, για κάθε πολυώνυμο p βαθμού n ως S_p το άθροισμα των παραγώγων του, δηλαδή:

\displaystyle S_p=\sum_{k=0}^np^{(k)},

όπου p^{(0)}=p, τότε μπορούμε να αποδείξουμε ότι:

\displaystyle I_p(a)=S_p(0)-e^{-a}S_p(a).

Πράγματι, με λίγες πράξεις παρατηρούμε ότι αν p είναι ένα πολυώνυμο n βαθμού:

\begin{aligned}\left(S_p(ax)e^{-ax}\right)'&=-ae^{-ax}S_p(ax)+ae^{-ax}S_p'(ax)=\\&=ae^{-ax}\left(S_p'(ax)-S_p(ax)\right)=\\&=ae^{-ax}\left(\sum_{k=1}^{n+1}p^{(k)}(ax)-\sum_{k=0}^np^{(k)}(ax)\right)=\\&=ae^{-ax}\left(p^{(n+1)}(ax)-p(ax)\right)=\\&=-ae^{-ax}p(ax),\end{aligned}

δεδομένου ότι οι παράγωγοι του p τάξης μεγαλύτερης του n είναι μηδενικές. Έτσι, ολοκληρώνοντας την παραπάνω ισότητα παίρνουμε:

\displaystyle I_p(a)=\int_0^1e^{-ax}p(ax)dx=\left[-S_p(ax)e^{-ax}\right]_0^1=S_p(0)-e^{-a}S_p(a),

όπως είχαμε πει. Τώρα, το παραπάνω είναι απλά ένα τέχνασμα, καθώς η «φυσιολογική» πορεία της απόδειξης είναι να ξεκινήσει κανείς από την αρχική προς ολοκλήρωση ποσότητα και σταδιακά, με ολοκληρώσεις κατά παράγοντες, να φτάσει στην τελική διαφορά. Ωστόσο, η συνάρτηση S_p θα μας φανεί χρήσιμη στην πορεία της απόδειξης και, συν τοις άλλοις, η απόδειξη είναι σχετικά μεγάλη, οπότε αποφασίσαμε να εξοικονομήσουμε λίγο χώρο και χρόνο με αυτό το μικρό κόλπο.

Επόμενο βήμα της απόδειξής μας είναι να αποδείξουμε ένα ακόμα ενδιάμεσο αποτέλεσμα. Θεωρούμε ένα πολυώνυμο q με ρίζες a_1,a_2,\ldots,a_n και παραγοντοποίηση:

p(x)=c(x-a_1)(x-a_2)\dots(x-a_n).

Με βάση αυτό, ορίζουμε το πολυώνυμο:

T_m(x)=x^{m-1}(p(x))^m,

όπου m είναι κάποιος θετικός ακέραιος – στην πορεία θα πούμε περισσότερα γι’ αυτόν. Τώρα, θα αποδείξουμε το εξής:

Αν το p έχει ακέραιους συντελεστές τότε οι συντελεστές του \sum_{k\geq m}T_m^{(k)} είναι πολλαπλάσια του p!.

Για αρχή, μη σας ξεγελάει το άθροισμα που εμφανίζεται παραπάνω, καθώς δεν είναι άπειρο αλλά πεπερασμένο – αφού οι παράγωγοι κάθε πολυωνύμου από ένα σημείο και μετά είναι μηδενικές. Τώρα, για να αποδείξουμε το παραπάνω δεν έχουμε να κάνουμε και πολλά – ασχέτως αν φαίνεται κάπως τρομακτικό το αποτέλεσμα. Αρκεί να παρατηρήσουμε ότι αν P είναι κάποιο πολυώνυμο με ακέραιους συντελεστές τότε όλοι οι συντελεστές της k-οστής (μη τετριμμένης) παραγώγου του είναι πολλαπλάσια του k!. Πράγματι, παρατηρήστε ότι αν:

P(x)=b_nx^n+\ldots+b_1x+b_0,

και k\leq n τότε ισχύει ότι:

P^{(k)}(x)=n(n-1)\dots(n-k+1)x^{n-k}+\dots+(k+1)k\dots2b_{k+1}x+k!b_k.

Το παραπάνω είναι άμεσο, αφού με κάθε παραγώγιση κατεβαίνει από τον εκθέτη μία δύναμη και εμφανίζεται ακόμα ένας παράγοντας στο γινόμενο μπροστά από τον συντελεστή του αντίστοιχου όρου. Τώρα, παρατηρούμε ότι κάθε συντελεστής είναι το γινόμενο ενός ακεραίου με το γινόμενο k διαδοχικών ακεραίων το οποίο είναι εύκολο να αποδείξουμε ότι διαιρείται από το k! – π.χ. με επαγωγή στο k η παρατηρώντας ότι το πηλίκο ενός τέτοιου γινομένου με το k! είναι ένας διωνυμικός συντελεστής και άρα ακέραιος αριθμός. Επομένως, έπεται το ζητούμενο, καθώς όλοι οι όροι στο άθροισμα:

\displaystyle\sum_{k\geq m}T_m^{(k)}

έχουν συντελεστές που διαιρούνται από το m! – δεδομένου ότι ο όρος T_m^{(k)} έχει συντελεστές που διαιρούνται από το k! το οποίο διαιρείται από το m! για κάθε k\geq m. Από το παραπάνω έπεται ότι οι συντελεστές των πολυωνύμων:

\displaystyle Q_m:=\frac{1}{m!}\sum_{k\geq m}T_m^{(k)},

είναι ακέραιοι. Τώρα θα αποδείξουμε το επόμενο ενδιάμεσο αποτέλεσμά μας:

Αν \displaystyle p(x)=c\prod_{k=1}^n(x-a_k) είναι ένα πολυώνυμο βαθμού n με ακέραιους συντελεστές και μιγαδικές ρίζες a_1,a_2,\ldots,a_n τότε για κάθε n+1-άδα ακεραίων αριθμών c_0,c_1,c_2,\ldots,c_n με c_0\neq0 για την οποία ισχύει ότι \displaystyle c_0+\sum_{k=1}^nc_ke^{a_k}=0 υπάρχει ένας αρκετά μεγάλος πρώτος αριθμός m έτσι ώστε \displaystyle c^{nm}\sum_{k=1}^nc_kQ_m(a_k)\not\in\mathbb{Z}.

Πρακτικά, το παραπάνω μας λέει ότι αν οι ρίζες ενός πολυωνύμου p ικανοποιούν την πρώτη εξίσωση τότε η ποσότητα:

\displaystyle c^{nm}\sum_{k=1}^nc_kQ_m(a_k),

παίρνει και μη ακέραιες τιμές για κατάλληλη τιμή του m. Το θέμα είναι, πώς θα το δείξουμε αυτό; Ας ξεκινήσουμε αξιοποιώντας μία σχέση που αποδείξαμε παραπάνω:

I_{T_m}(a_k)=S_{T_m}(0)-e^{-a_k}S_{T_m}(a_k).

Με τη βοήθεια της παραπάνω σχέσης παρατηρούμε ότι:

\begin{aligned}\sum_{k=1}^n-c_ke^{a_k}I_{T_m}(a_k)&=\sum_{k=1}^n-c_ke^{a_k}\left(S_{T_m}(0)-e^{-a_k}S_{T_m}(a_k)\right)=\\&=\sum_{k=1}^nc_kS_{T_m}(a_k)-\sum_{k=1}^nc_ke^{a_k}S_{T_m}(0).\end{aligned}

Από υπόθεση, γνωρίζουμε ότι c_0+\sum_{k=1}^nc_ke^{a_k}=0, επομένως έχουμε και:

\displaystyle-\sum_{k=1}^nc_ke^{a_k}=c_0.

Αντικαθιστώντας το ένα άθροισμα με το παραπάνω και πολλαπλασιάζοντας τη σχέση που προκύπτει με το c^{nm}, έχουμε:

\displaystyle c^{nm}\sum_{k=1}^n-c_ke^{a_k}I_{T_m}(a_k)=c^{nm}c_0S_{T_m}(0)+c^{nm}\sum_{k=1}^nc_kS_{T_m}(a_k).

Θεωρούμε τώρα τον αριθμό:

A:=\max\{|a_k|:k=1,2,\ldots,n\},

και παρατηρούμε ότι:

\begin{aligned}\left|I_{T_m}(a_k)\right|&=\left|\int_0^1c_ke^{-ac_kx}T_m(a_kx)dx\right|\\&\leq\int_0^1\left|a_ke^{-a_kx}T_m(a_kx)\right|dx\\&\leq Ae^A\int_0^1\left|T_m(a_kx)\right|dx\\&\leq Ae^A\int_0^1\left|(a_kx)^{m-1}(p(a_kx))^m\right|dx\\&\leq Ae^AA^{m-1}\int_0^1\left|x^{m-1}(p(a_kx))^m\right|dx\\&\leq A^me^A\int_0^1\left|p(a_kx)\right|^mdx.\end{aligned}

Ωραία ανισότητα, αλλά μπορούμε και καλύτερα. Για την ακρίβεια, αφού το p(a_kx) είναι πολυωνυμική συνάρτηση, είναι και συνεχής και, αφού είναι ορισμένη σε κλειστό διάστημα, παίρνει μέγιστη κι ελάχιστη τιμή – κι ας παίρνει μιγαδικές τιμές, δε μας απασχολεί – επομένως, υπάρχει ένας θετικός πραγματικός αριθμός M>0 έτσι ώστε:

\left|p(a_kx)\right|\leq M.

Έτσι, τελικά έχουμε:

\begin{aligned}\left|I_{T_m}(a_k)\right|&\leq A^me^A\int_0^1\left|p(a_kx)\right|^mdx\\&\leq A^m e^AM^m.\end{aligned}

Επομένως, έχουμε:

\displaystyle\left|c^{nm}\sum_{k=1}^n-c_ke^{a_k}I_{T_m}(a_k)\right|\leq|c|^{nm}\sum_{k=1}^n-c_ke^{a_k}A^me^AM^m=|c|^{nm}A^me^AM^mc_0.

Το παραπάνω άνω φράγμα μπορούμε να το γράψουμε ως εξής:

\left(|c|^nAe^AMc_0\right)\left(|c|^nAM\right)^{m-1}.

Δηλαδή, αν θέσουμε K=|c|^nAe^AMc_0 και L=|c|^nAM τότε έχουμε:

\displaystyle\left|c^{nm}\sum_{k=1}^n-c_ke^{a_k}I_{T_m}(a_k)\right|\leq KL^{m-1},

όπου τα K,L είναι ανεξάρτητα του m – αυτό θα παίξει ρόλο στην πορεία. Τώρα, από το σχολείο, ίσως, γνωρίζουμε ότι το παρακάτω όριο είναι πάντοτε μηδενικό – για κάθε x\in\mathbb{R}:

\displaystyle\lim_{n\to\infty}\frac{x^n}{n!}=0.

Επομένως, θα έχουμε και:

\displaystyle\lim_{m\to\infty}\frac{L^{m-1}}{(m-1)!}=0,

άρα και για αρκετά μεγάλες τιμές του m θα ισχύει ότι:

\displaystyle\frac{L^{m-1}}{(m-1)!}<\frac{1}{K}\Rightarrow KL^{m-1}<(m-1)!,

οπότε, τελικά, έχουμε το ακόλουθο κομψό φράγμα:

\displaystyle\left|c^{nm}\sum_{k=1}^n-c_ke^{a_k}I_{T_m}(a_k)\right|<(m-1)!.

Ωραία, ως εδώ έχουμε βρει ένα όμορφο άνω φράγμα για μία ποσότητα. Θα δούμε τώρα πώς μπορούμε να αξιοποιήσουμε τα παραπάνω. Αρχικά, ας θυμηθούμε ότι τα a_k είναι οι μιγαδικές ρίζες του πολυωνύμου p και, επειδή T_m(x)=x^{m-1}\left(p(x)\right)^{m}, έπεται ότι θα είναι και ρίζες του T_m και, μάλιστα, με πολλαπλότητα m, αφού, αναλυτικά έχουμε:

T_m(x)=c^mx^{m-1}(x-a_1)^m(x-a_2)^m\dots(x-a_n)^m.

Τώρα, αυτό σημαίνει ότι οι a_k είναι ρίζες και των παραγώγων τάξεως i του T_m για κάθε i=1,2,\ldots,m-1, δηλαδή T^{(i)}(a_k)=0 για k=1,2,\ldots,n και i=1,2,\ldots,m-1. Έτσι, έχουμε το εξής:

\displaystyle S_{T_m}(a_k)=\sum_{i\geq0}T_m^{(i)}(a_k)=\sum_{i\geq m}T_m^{(i)}(a_k),

αφού οι πρώτοι m όροι είναι μηδενικοί. Με ανάλογο σκεπτικό, δεδομένου ότι το 0 είναι ρίζα του T_m με πολλαπλότητα m-1 έπεται ότι T_m^{(i)}(0)=0 για i<m-1, επομένως έχουμε:

\displaystyle S_{T_m}(0)=\sum_{i\geq m-1}T_m^{(i)}(a_k)=T_m^{(m-1)}(0)+\sum_{i\geq m}T_m^{(i)}(0).

Τώρα, το T_m^{(m-1)}(0) είναι ο σταθερός όρος της $m-1$ τάξης παραγώγου του T_m οπότε είναι ίσος με (m-1)! επί τον συντελεστή του x^{m-1} στο T_m. Δεδομένου ότι T_m(x)=x^{m-1}\left(p(x)\right)^m, έπεται ότι ο συντελεστής του x^{m-1} είναι p(0)^m – καθώς δεν υπάρχει όρος με μικρότερο βαθμό στο T_m – και άρα:

T_m^{(m-1)}(0)=(m-1)!p(0)^m.

Έτσι, έχουμε, τελικά:

\displaystyle S_{T_m}(0)=(m-1)!p(0)^m+\sum_{i\geq m}T_m^{(i)}(0).

Με βάση τα παραπάνω παρατηρούμε ότι:

\begin{aligned}&\hphantom{=}\ \,c^{nm}c_0S_{T_m}(0)+c^{nm}\sum_{k=1}^nc_kS_{T_m}(a_k)=\\&=c^{nm}c_0(m-1)!p(0)^m+c^{nm}c_0\sum_{i\geq m}T_m^{(i)}(0)+c^{nm}\sum_{k=1}^nc_k\sum_{i\geq m}T_m^{(i)}(a_k).\end{aligned}

Εδώ να θυμηθούμε ότι:

\displaystyle Q_m=\frac{1}{m!}\sum_{i\geq m}T_m^{(i)}\Rightarrow \sum_{i\geq m}T_m^{(i)}=m!Q_m.

Έτσι, έχουμε:

\begin{aligned}&\hphantom{=}\ \,c^{nm}c_0S_{T_m}(0)+c^{nm}\sum_{k=1}^nc_kS_{T_m}(a_k)=\\&=c^{nm}c_0(m-1)!p(0)^m+c^{nm}c_0m!Q_m(0)+c^{nm}\sum_{k=1}^nc_km!Q_m(a_k)=\\&=c^{nm}c_0(m-1)!\left(p(0)^m+mQ_m(0)\right)+m!\underbrace{c^{nm}\sum_{k=1}^nc_kQ_m(a_k)}_{\Pi}.\end{aligned}

Η παράσταση \Pi είναι αυτή που θέλουμε να αποδείξουμε ότι παίρνει και μη ακέραιες τιμές για κατάλληλες τιμές του m. Έστω, προς άτοπο, ότι για κάθε επιλογή του m η παράσταση \Pi είναι ακέραια. Τότε, η παραπάνω παράσταση διαιρείται σαφώς από το (m-1)! ωστόσο, αν επιλέξουμε τον m αρκετά μεγάλο και πρώτο τότε η παραπάνω παράσταση δε διαιρείται από το m! – για την ακρίβεια, πρέπει να επιλέξουμε m μεγαλύτερο από c_0,c και p(0) – καθώς δε διαιρείται ο πρώτος όρος από το m – εδώ είναι που αξιοποιούμε ότι ο m είναι πρώτος. Έτσι η παράσταση:

\displaystyle c^{nm}c_0(m-1)!\left(p(0)^m+mQ_m(0)\right)+m!c^{nm}\sum_{k=1}^nc_kQ_m(a_k)

είναι ένας ακέραιος αριθμός που διαιρείται από το (m-1)! και, για αρκετά μεγάλο και πρώτο m, δε διαιρείται από το m!, συνεπώς η απόλυτη τιμή της θα είναι τουλάχιστον ίση με (m-1)!. Προσέξτε σε αυτό το σημείο ότι το γεγονός ότι η παραπάνω παράσταση δε διαιρείται από κάποιον αριθμό – εν προκειμένω τον m! – μας οδηγεί στο συμπέρασμα ότι δεν είναι μηδενική το οποίο είναι κρίσιμο – αλλιώς δεν μπορούμε να αποφανθούμε για την απόλυτη τιμή της ότι δεν είναι μηδενική. Τώρα, από το παραπάνω έχουμε, λοιπόν:

\displaystyle\left|c^{nm}c_0(m-1)!\left(p(0)^m+mQ_m(0)\right)+m!c^{nm}\sum_{k=1}^nc_kQ_m(a_k)\right|\geq(m-1)!.

Ωστόσο, προηγουμένως είχαμε αποδείξει την ακόλουθη ισότητα:

\begin{aligned}&\hphantom{=}\ \,c^{nm}c_0(m-1)!\left(p(0)^m+mQ_m(0)\right)+m!c^{nm}\sum_{k=1}^nc_kQ=\\&=c^{nm}c_0S_{T_m}(0)+c^{nm}\sum_{k=1}^nc_kS_{T_m}(a_k)=\\&=c^{nm}\sum_{k=1}^n-c_ke^{a_k}I_{T_m}(a_k).\end{aligned}

Συνεπώς:

\begin{aligned}(m-1)!&\leq\left|c^{nm}c_0(m-1)!\left(p(0)^m+mQ_m(0)\right)+m!c^{nm}\sum_{k=1}^nc_kQ_m(a_k)\right|=\\&=\left|c^{nm}\sum_{k=1}^n-c_ke^{a_k}I_{T_m}(a_k).\right|\\&<(m-1)!,\end{aligned}

που είναι άτοπο! Άρα, για κατάλληλα μεγάλο και πρώτο m πράγματι η παράσταση \Pi δεν παίρνει ακέραιες τιμές, όπως θέλαμε.

Το παραπάνω αποτέλεσμα αποτελεί τη ραχοκοκαλιά της απόδειξής μας, καθώς από εδώ κι εμπρός ο δρόμος είναι στρωμένος με ροδοπέταλα – σχεδόν…

Αλγεβρικό μέρος

Παραπάνω όσα κάναμε ήταν σχεδόν όλα σχετικά με τη μαθηματική ανάλυση: ολοκληρώματα, όρια, ανισότητες, πράξεις. Αν εξαιρέσει κανείς λίγο την επίκλησή μας στους πρώτους αριθμούς στο τέλος, όλα τα άλλα βήματά μας είχαν αμιγώς αναλυτικό χαρακτήρα. Τώρα ήρθε η ώρα για λίγη άλγεβρα – άλλωστε, δε θα ήταν λογικό να αποδεικνύαμε μία αλγεβρική ιδιότητα ενός αριθμού χωρίς να χρησιμοποιήσουμε άλγεβρα.

Η απόδειξή μας, από τη φύση της μας καλεί να πάμε με απαγωγή σε άτοπο. Αυτό και θα κάνουμε. Έστω ότι ο \pi είναι αλγεβρικός, δηλαδή ότι υπάρχει ένα πολυώνυμο \Pi με ακέραιους συντελεστές έτσι ώστε \Pi(\pi)=0. Αυτό άμεσα σημαίνει ότι και ο φανταστικός αριθμός i\pi είναι αλγεβρικός. Πράγματι, αφού ο \pi είναι αλγεβρικός, το ίδιο θα είναι και ο \pi^4. Αυτό είναι σχετικά απλό αφού, αρχικά:

\Pi\left(\pi^2\right)=a\left(\pi^2\right)+\pi b\left(\pi^2\right).

Στην ουσία, απλά στο a συμπεριλάβαμε όλους τους όρους άρτιου βαθμού ενώ στο b όλους τους όρους περιττού βαθμού, αφού βγάλαμε έναν κοινό παράγοντα. Τώρα, παρατηρούμε ότι για το πολυώνυμο:

Y(x):=a(x)^2-xb(x)^2,

ισχύει ότι:

Y(\pi^2)=a(\pi^2)^2-\pi^2b(\pi^2)^2=\left(a(\pi^2)-\pi b(\pi^2)\right)\left(a(\pi^2)+\pi b(\pi^2)\right)=0,

άρα και ο \pi^2 είναι αλγεβρικός, ομοίως και ο \pi^4=(\pi^2)^2.

Ωστόσο, επειδή i^4=1, έπεται ότι:

\pi^4=(i\pi)^4,

άρα και ο (i\pi)^4 είναι αλγεβρικός. Τώρα, αυτό σημαίνει ότι για κάποιο πολυώνυμο T με ακέραιους συντελεστές ισχύει ότι T\left((i\pi)^4\right)=0. Θεωρούμε, τώρα, το πολυώνυμο \tau με:

\tau(x)=T(x^4),

το οποίο έχει σαφώς ακέραιους συντελεστές και ισχύει ότι \tau(i\pi)=T\left((i\pi)^4\right)=0, επομένως και ο i\pi είναι αλγεβρικός. Τώρα, έστω p το πολυώνυμο ελαχίστου βαθμού με μοναδιαίο συντελεστή μεγιστοβάθμιου όρου το οποίο ικανοποιεί την:

p(i\pi)=0.

Αυτό το πολυώνυμο μπορούμε να το γράψουμε στη μορφή:

\displaystyle p(x)=\prod_{k=0}^n(x-\rho_k),

όπου υποθέτουμε ότι \rho_0=i\pi και ότι καμία από τις υπόλοιπες ρίζες δεν είναι μηδέν – αν ήταν, τότε το p δε θα ήταν ελαχίστου βαθμού. Έστω τώρα A_0 το σύνολο όλων των ριζών \rho_k καθώς και όλων των αθροισμάτων τους. Σαφώς, το A_0 είναι πεπερασμένο – έχει το πολύ 2^{n+1}-1 στοιχεία (γιατί;) – και με βάση αυτό, μπορούμε να παρατηρήσουμε ότι το ακόλουθο γινόμενο γράφεται ως άθροισμα ως εξής:

\displaystyle \prod_{k=0}^n(1+e^{\rho_k})=1+\sum_{a\in A_0}e^{a}.

Τώρα, από τη διάσημη ταυτότητα του Euler, έχουμε:

\displaystyle 1+e^{i\pi}=0\Leftrightarrow1+e^{\rho_0}=0\Rightarrow\prod_{k=0}^n(1+e^{\rho_k})=0\Leftrightarrow 1+\sum_{a\in A_0}e^a=0.

Τώρα, θεωρούμε το σύνολο A που ορίζεται ως εξής:

A=\{x\in A_0:x\neq0\}.

Με άλλα λόγια, το A περιέχει τα μη μηδενικά αθροίσματα των ριζών του p. Τότε, δεδομένου ότι e^0=1, μπορούμε να γράψουμε το εξής:

\displaystyle1+\sum_{a\in A_0}e^a=0\Leftrightarrow \underbrace{1+\#A_0-\#A}_{k}+\sum_{a\in A}e^a=0.

Με άλλα λόγια, μαζέψαμε μπροστά όλους τους άσσους και αφήσαμε μέσα στο άθροισμα μόνο εκείνα τα εκθετικά που δεν είναι τετριμμένα. Τώρα, θεωρούμε το πολυώνυμο:

\displaystyle P(x)=\prod_{a\in A}(x-a).

Από το κύριο αποτέλεσμα που αποδείξαμε στο αναλυτικό μέρος της απόδειξής μας, για c_k=1, c_0=k>0 και c=1 έπεται ότι από την υπόθεση:

\displaystyle k+\sum_{a\in A}e^a=0,

υπάρχει ένας αρκετά μεγάλος πρώτος αριθμός m έτσι ώστε:

\displaystyle \sum_{a\in A}Q_m(a)\not\in\mathbb{Z},

όπου:

\displaystyle Q_m:=\frac{1}{m!}\sum_{k\geq m}T_m^{(k)},

και, φυσικά:

\displaystyle T_m(x):=x^{m-1}\left(p(x)\right)^m.

Τώρα, ας παρατηρήσουμε ότι:

\displaystyle x^{k-1}P(x)=\prod_{a\in A_0}(x-a),

αφού υπάρχουν ακριβώς k-1 στο πλήθος στοιχεία στο A_0 τα οποία είναι μηδενικά, οπότε και x-a=x για κάθε μηδενικό a\in A_0. Τώρα, από όσα αναφέραμε για τους τύπους του Vieta, γνωρίζουμε ότι οι συντελεστές του πολυωνύμου x^{k-1}P(x) προκύπτουν από τις ρίζες του – δηλαδή τα στοιχεία του A_0 – μέσα από την εφαρμογή στοιχειωδών συμμετρικών πολυωνύμων. Τα στοιχεία, όμως, του A_0 είναι αθροίσματα (και τετριμμένα) των ριζών \rho_k, και, σαφώς, παραμένουν αναλλοίωτα αν απλώς μεταθέσουμε τη σειρά των ριζών \rho_k, επομένως μπορούμε να πούμε με ασφάλεια ότι οι συντελεστές του x^{k-1}P(x) προκύπτουν από εφαρμογή συμμετρικών (όχι κατ’ανάγκη στοιχειωδών) πολυωνύμων, έστω \tau_j, στις ρίζες \rho_k του p.

Από την άλλη, οι συντελεστές του p προκύπτουν από την εφαρμογή στοιχειωδών συμμετρικών πολυωνύμων στις ρίζες \rho_k. Για την ακρίβεια, όπως έχουμε δει, κάθε συντελεστής προκύπτει από την εφαρμογή ενός στοιχειώδους συμμετρικού πολυωνύμου στις ρίζες του p. Τώρα, από το θεμελιώδες θεώρημα των συμμετρικών πολυωνύμων συμπεραίνουμε ότι καθένα από τα \tau_j μπορεί να εκφραστεί ως ένα πολυώνυμο με ακέραιους συντελεστές των συντελεστών του p – που είναι στοιχειώδη συμμετρικά πολυώνυμα των ριζών του – συνεπώς κάθε συντελεστής του x^{k-1}P(x) είναι ρητός. Έτσι, αν M είναι το ΕΚΠ όλων των παρονομαστών των συντελεστών του, το πολυώνυμο:

Q(x)=MP(x)=M\prod_{x\in A_0}(x-a).

έχει ακέραιους συντελεστές, άρα το ίδιο ισχύει και για το πολυώνυμο:

q(x)=Mp(x)=M\prod_{a\in A}(x-a).

Τώρα, από το παραπάνω έπεται ότι και το πολυώνυμο Q_m έχει ακέραιους συντελεστές, επομένως, η παρακάτω έκφραση:

\displaystyle\sum_{a\in A}Q_m(a)

προκύπτει – με ανάλογο σκεπτικό – εφαρμόζοντας ένα πολυώνυμο με ακέραιους συντελεστές στους συντελεστές του q(x) οι οποίοι είναι επίσης ακέραιοι. Άρα, η παραπάνω παράσταση είναι ακέραια, άτοπο!

Επίλογος

Ουφ και πάλι ουφ! Κουραστήκαμε αρκετά αλλά, με αρκετή βοήθεια από πιο προχωρημένες έννοιες των μαθηματικών καταφέραμε να αποδείξουμε ένα από τα πλέον ιστορικά αποτελέσματα των μαθηματικών: ότι δεν υπάρχει πολυώνυμο με ακέραιους συντελεστές που να έχει ως ρίζα του τον \pi! Αυτό το αποτέλεσμα – αν και πρωτοαποδείχθηκε διαφορετικά – αποτελεί τον ακρογωνιαίο λίθο για μία σειρά από πολύ γνωστά και παλιά προβλήματα των μαθηματικών. Περισσότερα επ’ αυτού θα πούμε την ερχόμενη εβδομάδα!

Η κεντρική εικόνα είναι ο πίνακας Ο Αλεξάντερ Πούσκιν στην ακροθαλασσιά του Leonid Pasternak.

Διαβάστε επίσης: Μία γνωστή σχέση…

Ακολουθήστε το aftermathsgr στα social media:

2 comments

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Google

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση /  Αλλαγή )

Σύνδεση με %s