21 agosto, 2013

Una redefinición de la derivada (II)

Por qué el cálculo funciona

y por qué no.


N. del T. Este es el tercero de una serie de posts en los que he dividido el artículo original "A re-definition of the derivative"
0. Introducción  
2. Interludio histórico y una crítica de la demostración actual  <- Estás aquí

Para análisis más breves y menos técnicos sobre el cálculo contemporáneo, debes ir aquí[por traducir], aquí[por traducir] y aquí[por traducir].

Parte segunda:
Interludio histórico
y
una crítica de la demostración actual.


Tomemos un pequeño descanso de estos trabajos preliminares y volvamos a la historia del cálculo sólo un momento. En la historia, dos matemáticos fueron los que más se acercaron a darse cuenta de la diferencia entre el punto matemático y el punto físico. Pensarás que Descartes debió ser uno de ellos, puesto que inventó el diagrama. Pero no lo es. Aunque hizo un trabajo muy importante sobre la materia, su diagrama resultó ser el mayor obstáculo en la historia para una verdadera compresión del problema que he relatado aquí. Si hubiera visto la importancia operacional de todos los diagramas, habría descubierto algo realmente básico. Pero nunca analizó los campos creados por diagramas, ni el suyo ni ningún otro. No, el primero en flirtear con la solución fue Simon Stevin, el gran matemático flamenco de finales del siglo XVI. Él es la persona más responsable de la definición moderna de número, redefiniendo audazmente las definiciones griegas que nos llegaron a la era "moderna" vía Diofanto y Vieta [1]. Mostró el error de asignar el punto a la "unidad" o el número uno; el punto debía ser asignado a su magnitud análoga, que era el cero. Demostró que el punto era indivisible precisamente porque era el cero. Esta corrección tanto a la geometría como a la aritmética llevó a Stevin en la dirección de mi solución de aquí, pero nunca se dio cuenta de la trascendencia operacional del diagrama en geometría. Refinando los coceptos de número y punto, no vio que tanto los griegos como los modernos estabamos en posesión de dos conceptos diferentes del punto: el punto en el espacio y el punto en la diagramática.

John Wallis se acercó incluso más a este entendimiento. Siguiendo a Stevin, escribió ampliamente de la importancia del punto como un análogo a la nada. También realizó importantes trabajos sobre el cálculo, siendo quizás la mayor influencia para Newton. Estaba por lo tanto en la mejor posición históricamente para haber descubierto la disyunción de los dos conceptos de punto. Desafortunadamente continuó siguiendo la fuerte corrente del siglo XVII, que estaba dominada por las series infinitas y el infinitesimal. Después de que su estudiante Newton creara la forma actual del cálculo, los matemáticos no estaban ya interesados en las rigurosas definiciones de los griegos. La abstracción creciente de las matemáticas hizo que la elegancia ontológica de los antiguos pareciera pintoresca, si no pasada de moda. La corriente matemática desde el siglo XVIII ha sido considerablemente progresiva. Muchos nuevos campos han emergido, y estudiar los fundamentos no ha estado en boga. Por lo tanto se volvió menos y menos probable que alguien se diera cuenta de los errores conceptuales en las raíces del cálculo. Forasteros de las matemáticas como el obispo Berkeley en los principios del siglo XVIII no lograron encontrar los errores básicos (descubrió los efectos pero no las causas), y los éxitos de los nuevos matemáticos hicieron que discutirlo más a fondo fuera impopular.

Hasta ahora he criticado la habilidad del cálculo para encontrar valores instantáneos. Pero debemos recordar que Newton lo inventó  para ese preciso propósito. En De Methodis, propone dos problemas a resolver. 1) "Dada una longitud del espacio continuamente, encontrar la velocidad del movimiento en cualquier instante." 2)"Dada la velocidad del movimiento continuamnte, encontrar la longitud del espacio descrito en cualquier instante." Obviamente, el primero se resuelve por lo que ahora llammos diferenciación y el segundo por integración. A lo largo de los últimos 350 años, los fundamentos del cálculo han evolucionado de alguna forma, pero las preguntas que propone resolver y las soluciones que aporta, no lo han hecho. Esto es, todavía creemos que esas dos preguntas tienen sentido, y que es sensato que hayamos encontrado una respuesta para ellas.

La pregunta 1 trata de encontrar una velocidad instantánea, lo que es una velocidad sobre un intervalo de tiempo cero. Esto se hace todo el tiempo, hasta el día de hoy. La pregunta 2 es la inversa matemática de la pregunta 1. Dada una velocidad, encontrar la distancia viajada en un intervalo de tiempo cero. Esto ya no se hace, porque su absurdidad está clara. En la gráfica, o en la vida real, un intervalo de tiempo cero equivale a una distancia cero. No puede haber una distancia viajada en un intervalo de tiempo cero, incluso menos sobre una distancia cero, y la mayor parte de la gente parece entender esto. En lugar de tomar esto como un problema, sin embargo, los matemáticos y los físicos lo han enterrado. Ni siquiera se exhibe como una paradoja gloriosa, como las paradojas de Einstein. No, se dejó en el armario, si es que se recuerda que existe en absoluto.

Como debería estar ya claro por mi exposición de la ecuación de la curva, los dos problemas de Newton no están en forma matemática o lógica, y por lo tanto son irresolubles. Esto implica que cualquier método que proporcione una solución también debe tener una forma incorrecta. Si encuentras un método para obtener un número que no existe, entonces tu método es defectuoso. Un método que proporcione una velocidad instantánea debe ser un método sospechoso. Una ecuación obtenida por este método no puede ser de confianza hasta que se le dé una base lógica. No hay distancia sobre una distancia cero; y, del mismo modo, no hay velocidad sobre un intervalo cero.

El obispo Berkeley comentó los atributos ilógicos de las demostraciones de Newton poco después de que fueran publicadas (The Analyst, 1734). Irónicamente, las críticas de Berkeley a Newton eran un vivo retrato de las críticas del propio Newton al método de Leibniz. Newton dijo de Leibniz, "No tenemos una idea de las cantidades infinitamente pequeñas y por lo tanto introduje las fluxiones en mi método en el que se puede proceder usando cantidades finitas tanto como sean posibles." Y, "El sumatorio de indivisibles para componer un área o sólido nunca se ha admitido en Geometría."[2]

Este "usando cantidades finitas tanto como sean posibles" está muy cercano a la admisión de un fracaso. Berkeley llamó a las fluxiones de Newton "espíritus de las cantidades difuntas" que eran unas veces pequeños incrementos, y otras veces ceros. Se quejó de que el método de Newton procedía por una compensación de errores, y estaba lejos de estar solo en este análisis. Muchos matemáticos de la época se tomaron las críticas de Berkeley seriamente. Los matemáticos posteriores que eran mucho menos vehementes en sus críticas, incluyendo a Euler, Lagrange y Carnot, hicieron uso de la idea de una compensación de errores intentando corregir los fundamentos del cálculo. Así que sería injusto desestimar a Berkeley simplemente porque terminara en el lado equivocado de la historia. Sin embargo, Berkeley no pudo explicar por qué las ecuaciones obtenidas funcionaban, y la utilidiad de la ecuación finalmente pesó más que los recelos que los filósofos pudieran tener. Si Berkeley hubiera sido capaz de derivar las ecuaciones en términos claramente más lógicos, sus comentarios habrían sido tratados sin lugar a dudas con maś respeto por la historia. Tal como está la cosa, hemos llegado a un punto en el que citar a filósofos, y especialmente filósofos que eran además obispos, está lejos de ser un método convincente, y no voy a sacar más de eso. Es improbable que los físicos y matemáticos destetados de las ocurrencias de Richard Feynman encuentren las ocurrencias de Berkeley muy actualizadas.

Aprovecharé esta oportunidad para señalar, de todas formas, que mi crítica de Newton es de una clase categóricamente diferente al tipo de la de Berkeley, y de todos los filósofos que se han quejado de los infinitos en las demostraciones. No he criticado hasta ahora al cálculo por fundamentos filosóficos, ni lo haré. Las series infinitas tienen su lugar en las matemáticas, así como los límites. Mi argumento no es que uno no pueda concebir infinitos, infinitesimales o cosas por el estilo. Mi argumento ha sido y continuará siendo que la curva, ya sea un concepto o una abstracción matemática, no puede admitir lógicamente la aplicación de una serie infinita, en la forma del cálculo. Minimizando la reacción moderna a los puntos de vista de Berkeley, Carl Boyer dijo, "Puesto que las matemáticas tratan las relaciones más que la existencia física, su criterio de verdad es la consistencia interna en lugar de la plausibilidad en la luz del sentido de la percepción o la intuición."[3] Estoy de acuerdo, e insisto en que mi argumento principial ya adelantado aquí es que no hay consistencia interna en hacer que un diferencial [f(x + i) – f(x)] tienda a un punto cuando ese punto ya se expresa como dos diferenciales [(x-0) e (y-0)].

Boyer da la opinión de la mayoría de los matemáticos cuando defiende la velocidad instantánea de esta manera: "El argumento [de Berkeley] es por supuesto completamente válido al mostrar que la velocidad instantánea no tiene realidad física, pero esto no es razón para que, si se define de manera correcta o se toma como una día indefinida, no deba aceptar como una abstracción matemática."[4] Mi respuesta a esto es que los físicos han tratado la velocidad instantánea como una realidad física desde que Newton lo hizo. Más allá de eso, ha sido aceptada por los matemáticos como una idea indefinida, no como una idea correctamente definida, como Boter parece reconocer. No habría necesitado incluir la cláusula "o tomada como una idea indefinida" si todas las ideas necesitaran ser correctamente definidas antes de aceptarse como "abstracciones matemáticas". La idea de velocidad instantánea no se puede definir de manera correcta matemáticamente porque se obtiene de una ecuación que no puede ser definida de manera correcta matemáticamnte. A menos que Boyer quiera argüir que toda la heurística debería aceptarse como buenas matemáticas (posición la cual han aceptado los físicos contemporáneos, y las matemáticas actuales le pisan los talones), su argumento es un sinsentido.

Muchos matemáticos y físicos sostendrán que los fundamentos del cálculo han sido una cuestión cerrada desde que Cauchy en los años 1820, y que mi tesis al completo únicamente puede parecer quijotesca. Sin embargo, tan recientemente como en los años 1960, Abraham Robinson estaba intentando resolver aún problemas percibidos en los fundamentos del cálculo. Su análisis no estándar se inventó para este solo propósito, y generó bastante atención en el mundo de las matemáticas. La mayoría matemática no la ha aceptado, pero su existencia es una prueba de una inquietud extendida. Incluso en los más altos niveles (uno diría que especialmente en los más altos niveles) sigue habiendo preguntas sin respuesta acerca del cálculo. Mi tesis responde a esas preguntas mostrando los defectos que subyacen bajo el análisis estándar y el no estándar.

 Los problemas originales de Newton se deberían haber enunciado así: 1) Dada una distancia que varía a lo largo de un número de intervalos iguales, encontrar la velocidad durante cualquier intervalo propuesto. 2) Dada una velocidad variable durante un intervalo, encontrar la distancia viajada durante cualquier subintervalo propuesto. Estas son las preguntas que el cálculo realmente responde, como demostraré más abajo. Los números generados por el cálculo se aplican a subintervalos, no instantes ni puntos. El uso de Newton de las series infinitas, como las series de potencias, le llevó a creer erróneamente que las curvas dibujadas en gráficas podían ser expresadas como una serie infinita de diferenciales (que se desvanecen). Todos los otros fundadores del cálculo cometieron el mismo error. Pero, debido a la manera en que la curva se genera, no se puede expresar así. Cada punto de la gráfica ya es un par de diferenciales; por no tiene ni utilidad ni significado hacer que un diferencial propuesto tienda a un punto de la gráfica.

Para mostrar con precisión lo que quiero decir, miremos a la demostración actual de la ecuación de la derivada. Toma una ecuación de una función por ejemplo:

y = x²
Súmale δy y δx para obtener:
y + δy = (x + δx)² 
réstale a la primera ecuación la segunda:
δy = (x + δx)² - x² 
= 2xδx + δx²
divide por δx

δy /δx = 2x + δx

Haz que δx tienda a zero (sólo en el miembro derecho, por supuesto)
δy / δx = 2x
y' = 2x

La mayoría esperará que mi única crítica sea que δx no debería tender a cero en el lado izquierdo, porque eso implicaría que el cociente tendiera a infinito. Pero esa no es mi crítica principal en absoluto. Mi crítica principal es esta:

En la primera ecuación, las variables representan "todos los puntos posible de la curva" o "cualquier punto posible de la curva." La ecuación es cierta para todos los puntos. Ahora tomemos la última definición, porque la primera no nos deja jugar con ella. Así que en la primera ecuación, estamos en "cualquier punto de la curva". En la segunda ecuación, ¿Estamos todavía en cualquier punto de la misma curva? Algunos pensarán que (y + δy) y (x + δx) son las coordenadas de otro punto cualquiera de la curva—estando este punto cualquiera a alguna distancia del primer punto "cualquiera". Pero un examen atento mostrará que la segunda ecuación de la curva no es la misma que la primera. El punto cualquiera expresado por la segunda ecuación no está en la curva y = x². De hecho, debe estar exactamente a δy de la primera curva. Siendo esto cierto, debemos preguntar por qué querríamos restar la primra  ecuación de la segunda ecuación. ¿Por qué restamos un punto cualquiera de una curva con un punto cualquiera que está fuera de esa curva?

Más aún, al pasar de la ecuación 1 a la ecuación 2, hemos añadido cantidades diferentes a cada lado. Esto no se permite normalmente. Ten en cuenta que hemos añadido δy al miembro izquierdo y 2xδx + δx² al miembro derecho. Esto se podría haber justificado con algún razonamiento si nos proporcionara dos puntos cualesquiera de la misma curva, pero no lo hace. Hemos completado una operación ilegal sin razón aparente.
       
Ahora restamos el primer punto cualquiera del segundo punto cualquiera. ¿Qué obtenemos? Buen, deberíamos obtener un tercer punto cualquiera. ¿Cuáles son las coordenadas de ese tercer punto cualquiera? Es imposible decirlo, porque nos hemos deshecho de la variable y. Las cooredenadas son de la forma (x,y), pero acabamos de eliminar la y al restar. Deberías ver que δy no es lo mismo que y, así que quién sabe si estamos fuera de la curva o en ella. Al haber restado un punto de la primera curva de un punto fuera de la curva, tendríamos mucha suerte de haber acabado de nuevo en la primera curva, creo yo. Pero no importa, ya que estamos restando puntos a puntos. Restarle puntos a puntos es ilegal. Si quieres conseguir una longitud o un diferencial, debes restar una longitud a una longitud o un diferencial a un diferencial. Restarle un punto a otro punto sólo te dara una especie de cero—otro punto. Pero queremos que δy represente la longitud o diferencial en la tercera ecuación, así que podemos dividirla por δx. Tal como la demostración está ahora, δy debe ser un punto en la tercera ecuación. 

Sí, δy es ahora un punto. No es un "cambio en y", en el sentido que el cálculo quiere que sea. No es más la diferencia de dos puntos de la curva. ¡No es un diferencial! Ni es un incremento o intervalo de ninguna clase. No es una longitud, es un punto. ¿Que puede significar para un punto cualquiera tender a cero? La verdad es que no significa nada. Un punto no puede tender a longitud cero porque ya es un longitud cero.
Mira la segunda ecuación de nuevo. La variable y representa un número, pero la variable δy representa una longitud o un intervalo. Pero si y es un punto en la segunda ecuación, entonces δy debe ser un punto en la tercera ecuación. Eso hace dividir por δx en el siguiente paso una imposibilidad lógica y matemática. No puedes dividir un punto por una cantidad en absoluto, puesto que un punto es indivisible por definición. El paso final—hacer tender δx a cero—no se puede defender si solo estás llevando el denominador del miembro izquierdo a cero o si estás llevando la fracción a cero (lo que ha sido la pretensión de muchos). El cociente δy/δx ya estaba comprometido en el paso anterior. El problema no está en que el denominador sea cero; el problema es que el numerador es un punto. El numerador es cero.
Que yo sepa, la demostración del cálculo nunca se ha criticado de esta forma. Desde Berkeley en adelante la principal crítica se refería a explicar por qué el cociente δy/δx no era exactamente cero, y por qué hacer tender δx a cero no hacía que el cociente tendiera a infinito. Newton intentó explicarlo mediante el uso de cocientes originales y finales (prime and ultimate ratios), y se cree que Cauchy lo resolvió haciendo que el cociente tendiera a un límite. Pero de acuerdo con mi análisis el ratio ya tenía un numerador cero en el paso anterior, así que hacerlo tender a un límite es ridículo.

El análisis no estándar no tiene respuesta a esto tampoco. La definición "rigurosa" de Abraham Robinson de los infinitesimales no ha hecho nada para solucionar mi crítica. Añadir nueva terminología no clarifica el problema, porque no es la cuestión si una parte de estas ecuaciones se llama "estándar" o "no estándar". Si δy es un punto de la curva en la tercera ecuación, ya no es un infinitesimal. A partir de ese momento  no importa cómo lo llamemos, cómo lo definamos, o como axiomaticemos nuestra lógica. No es una distancia y no puede proporcionar lo que queremos, ni con infinitesimales, ni límites, ni series decrecientes ni con niguna otra cosa.

[Me han llegado varios correos de matemáticos furiosos a lo largo de los años, diciendo o insinuando que mencionar esta demostración es un tipo de falacia del hombre de paja. Me dicen que ellos no demuestran la derivada de esa manera y se enzarzan en una larga y tortuosa palabrería en ambas técnicas (las matemáticas y el inglés) para explicarme cómo hacerlo. Desafortunadamente, esta demostracción de arriba es mucho más que una falacia del hombre de paja. Es el modo en que me enseñaron cálculo en bachillerato a principios de los 80, y está expuesto por todo internet hasta el día de hoy. Si es un hombre de paja, es el hombre de paja del mismo mainstream, y mejor hubiera sido que dejaran de promocionarlo. Estos matemáticos están furiosos simplemente porque estoy usando sus propias ecuaciones contra ellos. Hacen referencias a Newton y Leibniz cuando les conviene, pero cuando otro los cita es una falacia del hombre de paja. Estos matemáticos son más escurridizos que las anguilas. Si les mencionas una demostración, te desvían a otra, asegurando que la otra ya ha sido reemplazada. Si luego destruyes la nueva, encuentran una tercera donde esconderse. Y nunca les verás abordar los argumentos principales de tus artículos. Por ejemplo, nunca he conseguido que un sólo matemático responda a los argumentos principales de este artículo. Los ignoran y buscan argumentos tangenciales en los que hacer que pierda el tiempo indefinidamente. Eso, por sí mismo, es una señal de los tiempos que vivimos.]

[1] Véase, por ejemplo, Jacob Klein, Greek Mathematical Thought and the Origin of Algebra.

N. del T. Este es el tercero de una serie de posts en los que he dividido el artículo original "A re-definition of the derivative"
0. Introducción  
2. Interludio histórico y una crítica de la demostración actual  <- Estás aquí