No no, si yo sé lo que es pero no tengo nada claro que el compañero lo sepa porque el tamaño de registros, cachés etc no depende en absoluto del sistema operativo. Un procesador de 64 bits tiene registros de 64 bits de ancho tenga el SO que tenga.
En la práctica la mayor diferencia está en la cantidad de memoria que puede direccionar. Hay muy poca diferencia en rendimiento en cualquier otro caso salvo que esté muy, muy optimizado, lo cual no ocurre con software general.
Si se trata de una máquina para uso general sin necesidades específicas, no va a ver casi ninguna diferencia.
Un sistema operativo compilado para arquitecturas de 32 bits, si tuviera que hacer la multiplicación del ejemplo con números 64 bits, la haría con mas operaciones. Ese sistema operativo en una arquitectura de 64 bits correría igual (porque "son compatibles") simplemente dejando sin usar "la mitad" de sus registros.
Si compilas el mismo sistema operativo para arquitectura de 64 bits, el compilador puede hacer que la multiplicación del ejemplo en 1 operación solo.
El hardware es el mismo, pero si el sistema operativo está compilado para usar solo "la mitad" del ancho de los registros, estás dejando parada "la mitad" de tu hardware y necesitaras operaciones adicionales.
Si lo compilas para que use todos sus recursos, el compilador podrá encontrar maneras mas rápidas y con menos instrucciones de hacer las cosas.
Y si, las diferencias de rendimiento son sensibles en muchísimo software, no estoy para nada de acuerdo en que en "software general" no se nota. Y mas en un sistema operativo, que no es una cosa de programa que se hace en dos tardes y que no tiene nada de dónde optimizar.
PD: Lo había leido muy rápido y se me había pasado. La limitación de la memoria RAM en sistemas de 32 bits que se puede direccionar se soluciona instalando un Kernel con soporte PAE, que permite hacer uso de 64 gigas de RAM con un linux de 32 bits.